【授業概要】
・テーマ
普段何気なく使う言葉を,コンピューターで処理を行い ,人間が活用できるようにするための,工学的なアプローチを学ぶ. 言語は,画像,音声に並び,主要な情報伝達手段であり,研究が盛んに行われている.プログラミング言語などの人工言語とは異なり,自然言語はその多様性と曖昧性により表現力が豊かであるが,その反面,複雑な解析技術が求められる. 本講義では,言語理論から始まり,様々な言語モデルに基づく解析技術を学ぶ.歴史的な流れを踏まえ,基本的な形態素解析,構文解析に始まり,現在の幅広く活用されている統計的機械学習による自然言語処理を紹介する.
・到達目標
(a) コンピューターで自然言語を処理するためにあたり直面する問題とその解決に必要となる手法を理解すること (b) 自然言語を解析するための形態素解析,構文解析アルゴリズムを身に付けること (c) コーパスを用いた統計的機械学習に基づく自然言語処理の手法を身に付けること
・キーワード
形態素解析,構文解析(句構造解析,係り受け解析),動的計画法,系列ラベリング,確率的言語モデル
【科目の位置付け】
学習・教育目標の(C)に相当する. この科目の基礎となる科目:確率統計学, オートマトンと言語理論 関連する科目:知識情報処理
【授業計画】
・授業の方法
講義形式で授業を行う.講義の理解度を見るために,適宜小テストを行う.また,レポートの提出も求めることがある.
・日程
第1,2週 自然言語処理入門 ,言語理論 第3,4週 形態素解析 第5-7週 構文解析(句構造解析,語彙化文法) 第8-10週 構文解析(係り受け解析) 第11週 辞書とコーパス 第12-13週 統計的機械学習法を用いた自然言語処理(テキスト分類法) 第14週 情報検索,意味解析 第15週 最終テストと解説 (上記はあくまでも予定であり,変更あり)
【学習の方法】
・受講のあり方
私語,講義中の出入りは厳禁.講義進行の妨げになる者は受講を認めない.講義中にスマホや携帯をいじるなど,受講態度の悪い者は以降の受講を許可せず,不可をつける.
・授業時間外学習へのアドバイス
予習は特に必要としないが,前の項目と次の項目との関連に留意すること. 多くの専門用語について,原語(ほとんど英語)も含めてよく理解すること.
【成績の評価】
・基準
総合点で60点以上を合格とする.
・方法
中間試験(40点),定期試験(40点),ミニテストの評価(20点)、合計100点で評価する.
【テキスト・参考書】
参考書は講義の中でそのつど指示する.必ずしも購入する必要はない.
【その他】
・学生へのメッセージ
この講義の基礎となる科目「確率統計学」と「オートマトンと言語理論」の内容を踏まえた講義である.
・オフィス・アワー
授業中に指示する
|