日本語入力を支える技術 ―変わり続けるコンピュータと言葉の世界 WEB+DB PRESS plusの詳細を見る

日本語入力を支える技術 ―変わり続けるコンピュータと言葉の世界 WEB+DB PRESS plus [Kindle]

著者 : 徳永拓之

技術評論社 (2018年11月14日発売)

4.50

本棚登録 : 8人

感想 : 2件

サイトに貼り付ける

本ページはアフィリエイトプログラムによる収益を得ています

Amazon.co.jp ・電子書籍 (456ページ)

感想・レビュー・書評

並び替え

いいね順
新着順

表示形式

リスト
全文

表示件数

絞り込み

gunmakeさんの感想

フォロー

2021年6月26日

1章日本語と日本語入力システムの歩み
　最初は単文節変換であったがそこから今普及している連文節変換に進歩していった。現在統計的手法、機械学習を利用した方法を適用されている。
日本語入力システムとしてはMicroSoftのIMEとジャストシステムのATOKの2強の時代を迎えるが2009年からGoogleとBaiduから新しい日本語入力システムの発表があった。
2章日本語入力の概観
　日本語入力システムはかなり複雑。あとの章で１つ１つ解説していく。
3章かな漢字変換エンジンに用いられているデータ構造
　かな漢字変換に用いるデータ構造としては、つまり辞書に用いられているデータ構造としてはマップ構造（ハッシュテーブル）が用いられている。辞書を引くとき効率的な共通接頭辞書検索をトライと呼ばれるデータ構造を用いている。あとダブル配列、LOUDSという方法も用いられている
4章かな漢字変換システムの実装
　単語などをノードとし考えそれらをエッジとして結び文書全体を１つのグラフとして考え最短経路問題として解く
5章統計・機械学習のアルゴリズムとその応用
　最近機械学習とかいろいろ聞くがこの本がでたのが2012年なのでそのころからすでに応用問題として考えられていたのですね。
6章日本語入力のこれから
　予測入力（携帯なので採用されている）など

そういえばいろんな日本語入力システムがあった、なつかしい。

0

詳細をみる
コメント0件をすべて表示
b_a_a_d_oさんの感想

フォロー

2021年5月3日

なかなか濃ゆい本だった（小並感）。

0

詳細をみる
コメント0件をすべて表示

全2件中 1 - 2件を表示

著者プロフィール

2007年東京大学大学院情報理工学系研究科修士課程修了。ヤフー、Preferred Infrastructure、スマートニュースを経て、2018年からLeapMindに勤務。機械学習、自然言語処理、画像処理などに興味がある。

「2019年『Practical Developers ――機械学習時代のソフトウェア開発［ゲームアプリ/インフラ/エッジ編］』で使われていた紹介文から引用しています。」