【授業の目的】
データ数と次元数(特徴数)がともに大きいビッグデータを分類する方法を理解した上で,実際の問題に適切に応用できる力を養うことを目的とします. 具体的には,データサイエンス(あるいは計算機科学)の主要なサブカテゴリである統計的機械学習を,実践的に学びます.疑似コードとして与えられたアルゴリズムを,UNIXマシンの上で,主にPython3を用いて実装します.本授業では,統計的機械学習において基本的な分類アルゴリズム(ブースティング,パーセプトロン)を取り扱う予定です.
【授業の到達目標】
この授業を履修した学生は, ・統計的機械学習をUNIX上で動作させるために必要なコマンドを使用できる. ・疑似コードで書かれた統計的機械学習のアルゴリズムを主にPython3を用いて実装できる. ・統計的機械学習における分類アルゴリズム(ブースティング,パーセプトロン)の違いを説明できる.
【授業概要(キーワード)】
統計的機械学習,分類アルゴリズムの実装,ブースティング,パーセプトロン,UNIX
【学生主体型授業(アクティブラーニング)について】
A-1.ミニッツペーパー、リフレクションペーパー等によって、自分の考えや意見をまとめ、文章を記述し提出する機会がある。:1~25%
【科目の位置付け】
本授業は,主に「データからの知識獲得」にまつわる課題について,データサイエンスの観点から実践的に学ぶとともに,実践した結果を論理的に分析することで,解決策を提案する力を身につけるためのものです.
【SDGs(持続可能な開発目標)】
09.産業と技術革新の基盤をつくろう
【授業計画】
・授業の方法
UNIXコマンドおよびプログラミング言語に慣れ親しむことから始め,疑似コードで書かれた統計的機械学習のアルゴリズムをUNIX上で動作させる演習を行っていく予定です.
・日程
第1回 ガイダンス,UNIXを使ってみよう. 第2〜4回 UNIXコマンドに慣れよう. 第5〜8回 プログラミングに慣れよう. 第9回 1つのキーワードを用いてテキストデータを分類するプログラムを書いてみよう. 第10回 分類結果を評価するプログラムを書いてみよう. 第11回 複数のキーワードを用いてテキストデータを分類するプログラムを書いてみよう. 第12〜13回 ブースティングを用いてテキストデータを分類するプログラムを書いてみよう. 第14〜15回 パーセプトロンを用いてテキストデータを分類するプログラムを書いてみよう.
【学習の方法・準備学修に必要な学修時間の目安】
・受講のあり方
ウェブクラスで配布する予定のテキストを活用しながら,UNIXマシンを積極的に使ってみてください.
・授業時間外学習(予習・復習)のアドバイス
授業で取り扱う内容の予習・復習を行ってください. ウェブや図書館で自分で調べる,または,他の受講者と議論することも推奨します. なお,自主的な学修時間の目安は4時間/週です. (注)大学設置基準では、1単位の授業科目は45時間の学修を必要とする内容をもって構成することが定められています.
【成績の評価】
・基準
統計的機械学習の目的を理解し,疑似コードで書かれた統計的機械学習のアルゴリズムをUNIXマシンで動かせるようになることを,合格の基準とします.
・方法
各回のレポートを7点として,7点×15回=合計105点を予定しています.得点が100点を超えた場合は最終的な成績を100点とします.
【テキスト・参考書】
テキストは,ウェブクラスで配布する予定です.参考書は,授業のなかで提示する予定ですが,必ずしも購入する必要はありません.
【その他】
・学生へのメッセージ
各回の授業に参加した結果,「どこまで分かったか」「どこから分からなくなったか(どんなクエスチョンが新たに生まれたか)」を,ことばに直してメモ書きすることをおすすめします.
・オフィス・アワー
基本的には授業終了後から12:20までとしますが,随時,地教2号館4階434までどうぞ(事前にウェブクラスからメールでアポイントメントをとると確実です).
|