Statisticsライブラリ

  • 統計解析を行うライブラリです。
  • 副産でつくったMathMatrixの方が使えるかも。

構成

  • BasicStatisticsクラス: 基礎統計クラス(平均・分散・共分散など、基本的な統計計算を行う静的クラス)
  • Matrix:行列関連クラス
    • MathMatrixクラス: 行列計算クラス(2元配列をベースとした、行列計算を行う静的クラス)
      • 一部、nutsuさんのソースを参考にさせていただきました。
    • MathObjectクラス: 行列オブジェクトクラス(MathMatrixクラスをベースに、データの保持機能を加えたクラス)
  • MultivariateAnalysis: 多変量解析関連クラス
    • PrincipalComponentAnalysis: 主成分分析クラス(データ全体の構造を分析する手法)
    • QualificationIV: 数量化理論Ⅳ類クラス(データの位置関係を分析する手法)
  • test:検定関連クラス
    • Ttest: t検定クラス
    • ANOVA: 一元配置分散分析クラス

コード

使い方

参考

*Spark project 勉強会 #02でyossyさんよりご質問いただいた、ライブラリ作成にあたっての参考書ですが、基本的なところはこの本をそのまま移植しました。

*パソコンで学ぶ多変量解析の考え方

ただ、多変量解析を行うための固有値、固有ベクトルの計算などの処理(ヤコビ法とか)はCやJAVAで公開されているものを元に、解析して移植しました。これが一番面倒やった。

ロードマップ的なもの

  • 固有値計算の際のfor文処理が重いので、TIMERとかで繰り返すように変更する予定
  • Threadをお借りして、処理を簡単にしたい
  • 実践的なアプリをつくる(つーか、昔作ったものが消えたので、リビルドする)
  • 他の解析を組み込む