データサイエンス特講A
 Special Lectures on Data Science A
 担当教員:木村 宏人(KIMURA Hirohito),脇 克志(WAKI Katsushi)
 担当教員の所属:理学部理学科
 担当教員の実務経験の有無:
 担当教員の実務経験の内容(有の場合):東芝で医療システムの研究開発に従事し、山形大学Well-Being研究所で医学部研究者に対するAIセミナー講師をした経験を生かして、プログラムコードレベルで仕組みの分かる実践的な授業を展開する。
 開講学年:3年,4年  開講学期:第1ターム  単位数:1単位  開講形態:講義
 開講対象:理学部理学科  科目区分:選択科目 
【授業の目的】
インターネットとIoTの進展による近年のデータ爆発は、人間のデータ処理能力の限界をはるかに超えるレベルに達しています。加えて日本は世界に先駆けて人口減少の局面に突入しました。今世紀中に総人口が6割に減少するとも予測され、多くの地域の消滅や社会活力低下が懸念されています。このため現代の日本ではDX推進によるデータ処理の自動化と業務の効率化、スタートアップによる新産業の創出が喫緊の課題になっています。
一方、過去10年間続いてきた第3次AIブームでは、ディープラーニング(深層学習)技術が大きく発展しました。この技術を用いれば、画像や音などの構造化されていないデータから、内在されている特徴を抽出することが可能であるため、これまで解決が難しかった課題が解決でき、自動化や業務の効率化のみならず新産業の創出を大きく推進できる可能性があります。
この授業では,主としてニューラルネットワークを用いた教師あり学習の基本的な仕組みを解説し、さらにその応用としてディープラーニング(深層学習)技術を様々な形態のデータに適用する方法を解説し、現実の課題解決に適用できる実践力の養成を目的にします。

【授業の到達目標】
この分野は日々凄いスピードで発展を続けており、理論よりも実践応用が先行している分野です。最新の技術は次々にオープンソースソフトウェア(OSS)として公開されつづけており、OSSを理解し適切に使いこなすことが最新技術の理解に必要なだけでなく、競争力のある産業の育成や社会の活性化等の観点からも非常に重要であると考えられています。この授業では、 OSSを活用してPythonで記述した実践的なサンプルプログラムを提示します。受講者はこれを実際に動作させて結果を確認することで、ニューラルネットワークを用いた教師あり学習の仕組みと応用をプログラムレベルで理解し,現実の課題解決を自分の手でプログラムレベルで実施できる能力を身に着けることを目指します。具体的には以下が実施できる能力を身に着けることを目標とします:
○データ分割(訓練・検証・テストデータへの分割)の必要性を理解し実施できる
○(ニューラルネットワークによる)学習モデルを理解し作成できる
○訓練データでモデルを訓練し、検証データで訓練の進捗を確認し、学習済みモデルを構築できる
○テストデータで学習済みモデルの性能を評価できる
○現実の課題に対して、転移学習モデルも活用して、上記のサイクルを適用できる

【授業概要(キーワード)】
AI、データサイエンス、深層学習、OSS、Python、CNN、転移学習

【学生主体型授業(アクティブラーニング)について】
D-1.演習、実習、実験等を行う機会がある。:51~75%
D-2.事前学習(下調べ、調査等含む)で習得した知識等を踏まえて演習、実習、実験等を行う機会がある。:1~25%
D-3.習得した知識を活用する中で、学生自身がテーマや目的などを主体的に定めて課題探究型の演習、実習、実験等を行う機会がある。:1~25%

【科目の位置付け】
この授業は、理学部ディプロマ・ポリシー「専門的な素養を基盤に科学的思考方法に従って社会が要請する課題を解決する能力を身に付けている」に関連する理学専門科目(データサイエンスコース)となる。

【SDGs(持続可能な開発目標)】
01.貧困をなくそう
02.飢餓をゼロに
03.すべての人に健康と福祉を
04.質の高い教育をみんなに
05.ジェンダー平等を実現しよう
06.安全な水とトイレを世界中に
07.エネルギーをみんなにそしてクリーンに
08.働きがいも経済成長も
09.産業と技術革新の基盤をつくろう
10.人や国の不平等をなくそう
11.住み続けられるまちづくりを
12.つくる責任つかう責任
13.気候変動に具体的な対策を
14.海の豊かさを守ろう
15.陸の豊かさも守ろう
16.平和と公正をすべての人に
17.パートナーシップで目標を達成しよう

【授業計画】
・授業の方法
通常は、前半に講義形式で説明をした後で、後半にパソコンを使ったプログラム実習を行います。実習プログラムの実行時間が長いことが予想される場合には、実習プログラムを実行しながら講義をすることもあります。
・日程
(1) 教師あり学習とデータ分割
(2) ニューラルネットワークの学習
(3) 音データの分類
(4) 画像データの分類
(5) 畳み込みニューラルネットワーク(CNN)
(6) 深層学習モデルの転移学習
(7) 深層学習モデルの応用:動画像からの物体検出(YOLO)
(8) 深層学習を用いたデータ解析:心電図解析例

【学習の方法・準備学修に必要な学修時間の目安】
・受講のあり方
実習はGoogle Colaboratoryの環境で行います。受講者は大学のメールをGoogleアカウントとして利用しますので、パスワードを入力できるように確認して置く必要があります。
・授業時間外学習(予習・復習)のアドバイス
実習教材はPythonプログラムで作成しています。受講者はPythonの文法を理解し、簡単なプログラムが作成できる程度のスキルを取得していることを前提にしています。Pythonプログラムに自信のない人は、各自で事前に学習しておくことをお勧めします。

【成績の評価】
・基準
授業への出席点を50%、各回の授業後に実施する確認クイズ(小テスト)点を50%とします。
・方法
毎回の授業後にWebClass上に確認クイズ(小テスト)を掲載します。次回の授業までの間に確認クイズに回答してください。確認クイズの中には、実習教材の最後に提出課題として指示されるものもあります。全ての確認クイズで合格点(60%)を取ることが必要です。

【テキスト・参考書】
テキスト: 講義資料を各授業開始前までに共有します。
参考書:  特に設けません。

【その他】
・学生へのメッセージ
○ 情報を学んだ証しは、プログラムを道具として駆使できるようになること
○ 文字列やデータをプログラムで処理できることは、プログラムを道具として使えるようになる第一歩
○ 生成AIを相棒にしてプログラムは「習うより慣れろ」
・オフィス・アワー
WebClass上に「質問コーナー」を準備します。

31600220-2024-03-31305