言語の科学<9> 言語情報処理
長尾 真, 黒橋 禎夫, 佐藤 理史 著
内容
目次
〈言語の科学〉へのいざない 学習の手引き 1 テキスト処理 1.1 コンピュータ内部での文字の扱い (a) 文字コードセット (b) 文字コード体系 1.2 文字の表示 (a) 文字表示の仕組み (b) フォント 1.3 テキストの表現形式 (a) SGML (b) HTML (c) TeX (d) PostScriptとPDF 1.4 文字列の整列 (a) 辞書式順序 (b) クイックソート (c) 基底法 (d) Nグラム統計とKWIC 1.5 文字列の探索 (a) 2分探索 (b) ハッシュ法 (c) トライ法 1.6 文字列の照合 (a) 完全一致 (b) 正規表現の照合 (c) 近似照合 1.7 テキストデータベース 第1章のまとめ 2 情報検索 2.1 情報検索と情報検索支援 2.2 情報検索システム (a) 情報検索システムの枠組 (b) 伝統的なキーワード検索 (c) 検索システムの評価 (d) 問題点 2.3 検索システムの高度化 (a) ベクトル空間法 (b) 関連フィードバック法 (c) 検索質問の自動合成 (d) パッセージ検索 2.4 全文検索 (a) 単語インデックスを用いた全文検索 (b) 文字列インデックスを用いた全文検索 2.5 情報の組織化 (a) 選別 (b) 分類 (c) 重要情報の抽出 (d) 要約 2.6 インターネットと情報検索 (a) ワールドワイドウェブ (b) ウェブページの検索 2.7 展望 第2章のまとめ 3 機械翻訳 3.1 機械翻訳の原理 (a) 人間の翻訳と機械の翻訳 (b) 言語の約束とその解析 3.2 機械翻訳の方式 (a) 機械翻訳の基本方式 (b) 構文解析型トランスファー方式 (c) 意味解析型トランスファー方式 (e) 各種の翻訳方式 (f) 話し言葉の翻訳 3.3 機械翻訳システムの構成技術 (a) 日本語の文法解析 (b) 日本語の意味解析 (c) 日英変換技術 (d) 英語生成技術 3.4 翻訳辞書構成技術 (a) 翻訳知識ベースとしての辞書 (b) 機械辞書の役割 (c) 辞書の分類と参照順序 (d) 文法的解析のための辞書 (e) 意味解析のための辞書 (f) 機械翻訳用の辞書の構成 3.5 翻訳システムの現状と適用分野 (a) 翻訳能力の達成レベル (b) 機械翻訳の適応分野 (c) 機械翻訳適用の方法 3.6 機械翻訳を取り巻く諸問題 (a) 機械翻訳の基本問題 (b) 当面する課題 第3章のまとめ 4 言語の統計 4.1 ことばの数量化 (a) 言語について数を数えるということ (b) 言語を測るものさし (c) ものさしの条件 4.2 統計的操作の基礎知識 (a) 言語の計量的研究の歴史 (b) 記述統計と推測統計 (c) 語彙分布の法則 4.3 語彙調査の方法 (a) 調査の企画 (b) 調査の目的 (c) 調査の方法 (d) 語彙調査の手順 (e) 調査単位 (f) 同語異語の判別 (g) 語彙の意味分布についての分析 4.4 日本語の語彙調査例 (a) 雑誌九十種の語彙調査 (b) 新聞の語彙調査 (c) 高校教科書の語彙調査 (d) 話しことばの語彙調査 (e) テレビ放送の語彙調査 (f) 流行歌の語彙調査 4.5 語彙の対照研究 (a) 『星の王子さま』6か国語版の語彙の対照 (b) 中国流行歌と日本語の逐語訳の比較 第4章のまとめ 用語解説 読書案内 参考文献 索引