【授業の目的】
データサイエンス的な物の見方を身につけるため、その基礎をなす確率の概念や計算技術について学ぶ。 データサイエンスで用いられる基本的な分析手法の概要を知る。
【授業の到達目標】
(1)確率、確率変数、確率分布といった確率論の基本的な概念を理解し、説明することができる。【知識・理解】 (2)相関係数やエントロピーなどの指標を正しく計算することができる。【技能】 (3)データ分析で用いられる基本的な手法の概要を説明することができる。【知識・理解】
【授業概要(キーワード)】
確率、エントロピー、決定木、クラスタリング
【科目の位置付け】
データサイエンスにおける専門領域の学修がスムーズにおこなわれるよう、数学的な基盤を固めるための科目である。
【SDGs(持続可能な開発目標)】
04.質の高い教育をみんなに 09.産業と技術革新の基盤をつくろう
【授業計画】
・授業の方法
パワーポイントによるプレゼンテーションで授業を行う。また、演習時間を設ける。
・日程
主要なテーマは次の通りである。 第1回:確率論の基礎、周辺確率、条件付き確率 第2回:確率論の基礎、ベイズの定理 第3回:連続変数の関連性、ピアソンの相関係数、ケンドールの順位相関係数 第4回:離散変数の関連性、クラメールの連関係数、相関比 第5回:情報理論の基礎、情報エントロピー、相互情報量 第6回:線形回帰 第7回:決定木 第8回:中間試験とその解説 第9回:階層的クラスタリング 第10回:非階層的クラスタリング 第11回:統計的仮説検定の概要 第12回:ブートストラップ法 第13回:ランダムフォレスト 第14回:データ分析の適用事例 第15回:期末試験とその解説
【学習の方法・準備学修に必要な学修時間の目安】
・受講のあり方
単なる暗記で済ませずに、数式の意味を理解するように努めること。不明な点はそのままにせず、質問をすること。
・授業時間外学習(予習・復習)のアドバイス
高校で学んだ確率の知識を復習しておくこと。 講義中に扱うトピックは基本的なことなので、十分に理解できるように、分かるまで何度でも繰り返し学習すること。 自主的な学修時間の目安は4時間/週である。 (注)大学設置基準で、1単位の授業科目は45時間の学修を必要とする内容をもって構成することが標準と定められている。
【成績の評価】
・基準
以下の観点で、主に試験の結果により評価する。 (1)確率、確率変数、確率分布の概念を理解し、説明することができる。 (2)相関係数やエントロピーなどの基本的な量を正しく計算することができる。 (3)基本的なデータ分析手法の概要を理解している。
・方法
受講態度(20%)と筆記試験2回(80%)の合計点によって評価する。
【テキスト・参考書】
事前にテキストとして指定するものはないが、授業進度、学生の理解に合わせて、適宜、指定する。また、参考図書は講義の際に紹介する。
【その他】
・学生へのメッセージ
データサイエンスを修得する上での基礎を学ぶ科目である。データサイエンスに興味のある学生は、本講義の内容をきちんと身につけること。
・オフィス・アワー
月曜日の12:30~13:30の間に設ける。会議や出張等で不在にすることもあるため、確実に面談したい場合は事前に予約をお願いする。連絡先は、初回の授業で周知する。
|