テキストマイニング
 Text Mining
 担当教員:鈴木郁美(SUZUKI Ikumi)
 担当教員の所属:理工学研究科
 開講学年:3年  開講学期:前期  単位数:2単位  開講形態:講義
 開講対象:情報科学科  科目区分:専門科目・選択必修 
【授業の目的】
1) 普段何気なく使う言葉を,コンピューターで処理を行い ,人間が活用できるようにするための,工学的なアプローチを学ぶことを目的とする.
2) 言語理論から始まり,様々な言語モデルに基づく解析技術を学ぶ.基本的な形態素解析,構文解析から現在幅広く活用されている統計的機械学習によるテキストマイニングや自然言語処理技術の理解、習得を目的とする.

【授業の到達目標】
1) コンピューターでテキストや自然言語を処理するためにあたり直面する問題とその解決に必要となる手法を説明できる.【知識・理解】
2) 自然言語を解析するための形態素解析,構文解析アルゴリズムを動かすことができる.【技能】
3) コーパスを用いた統計的機械学習に基づく自然言語処理の手法を操作できる.【技能】

【授業概要(キーワード)】
形態素解析,構文解析(句構造解析,係り受け解析),動的計画法,系列ラベリング,確率的言語モデル

【科目の位置付け】
学習・教育目標の(C)に相当する.
この科目の基礎となる科目:確率統計学, オートマトンと言語理論

【授業計画】
・授業の方法
講義形式で授業を行う.講義の理解度を見るために,適宜ミニテストを行う.また,レポートの提出も求めることがある.
・日程
第1週 講義の進め方とガイダンス
第2週 テキストマイニング,自然言語処理入門
第3-5週 形態素解析
第6-7週 言語理論
第8-11週 構文解析(句構造解析, 係り受け解析), 中間テストと解説
第12週 辞書とコーパス
第13-14週 統計的機械学習法を用いた自然言語処理(テキスト分類法)
第15週 定期試験と解説

(上記はあくまでも予定であり,変更あり)

【学習の方法】
・受講のあり方
パワーポイントや板書される講義内容をノートに筆記して内容の理解につとめる.私語など講義進行の妨げになる行為は慎む.
・授業時間外学習へのアドバイス
講義中に行うミニテストでわからなかった問題を復習することで,講義内容の理解を深める.

【成績の評価】
・基準
中間試験および定期試験、2回の試験の総合点で60点以上を合格とする.
・方法
中間試験(50点),定期試験(50点)、合計100点で評価する.

【テキスト・参考書】
参考書 
黒橋禎夫著「自然言語処理」(放送大学教育振興会)
奥村学著「自然言語処理の基礎」(コロナ社)
高村大也著「言語処理のための機械学習入門」(コロナ社)

【その他】
・学生へのメッセージ
この講義の基礎となる科目「確率統計学」と「オートマトンと言語理論」の内容を踏まえた講義である.
・オフィス・アワー
鈴木研究室(8号館217号室)において,火曜10時30分-11時30分の間に設けます.
質問等がある場合は,授業終了後に直接お問い合わせください.

51000466-2019-05-53511