プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)

  • 648人登録
  • 4.09評価
    • (38)
    • (34)
    • (27)
    • (1)
    • (0)
  • 28レビュー
著者 : 矢野啓介
  • 技術評論社 (2010年2月18日発売)
  • Amazon.co.jp ・本 (400ページ)
  • / ISBN・EAN: 9784774141640

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)の感想・レビュー・書評

並び替え:

表示形式:

表示件数:

  • 文字集合と符号化方式の違いすら意識していなかった自分でも、本書を読むことで一から文字コードの基本と、それにまつわる問題を理解することができた。

    とっても丁寧に細かいところまで解説してくれているし、完璧とまではいかないにしろ、これさえ読めばエンジニアが通常理解しておくべき文字コードの知識は習得できると思う。買った目的を文句なしに達成できた本。

    それにしても、今まで文字コードをないがしろにしていた自分が恥ずかしい。理解できた今となってはかなり違った景色が見える。

  • 体系的に書かれていそうだったので、買ってみた。

  • nkf iconvなどの文字コード関連ツールの存在が再認識。
    ascci 7ビットの1バイト

  • 請求記号 007.63/Y 58

  • 仕事で文字コードを気にしないといけない場面がちょくちょくあるけど基礎知識がないので読んでみた。
    ASCIIから始まる文字コードの歴史と代表をわかりやすくまとめてある。一通り読んだけど、職場に置いて困ったことがあったら参考にしよう。
    個人的には汎用機にも関わるから、すっぱりカットされたEBCDICも解説して欲しかったけど。

  • ミャンマーで使われている文字セットについて理解するためにだいぶ前に購入。EmojiのUNICODEへの取り込みを契機に再読する。
    計算機のリソースに余裕がうまれた今の時代に、文字は減らしてはならないとおもった。

  • 文字コードにまつわる基本的知識について、実にうまくまとめられていて読んでいて楽しい。プログラマのための、とタイトルにあって、実際JavaやRubyでの文字コードの扱い方を書いた一章があるが、それ以外の内容は特にプログラマ向けではない。文字をどうやってビット列・バイト列で表現するかは特にプログラマに限った話でなく、文字コードという発想そのものがそうした問題なのだから。

    文字コードの世界は実に複雑怪奇。もともと表意文字を多く用いる日本語などの言語をまったく考慮せず、アルファベットといくつかの記号くらいで定義されたASCII(それでも英語圏以外では早くも苦労したわけだが)から始まった文字コードは、様々な国や様々なグループで独自の発展を遂げている。発展の中では、当時メモリやネットワーク帯域が小さかった故に、工夫をして複雑になっているJIS-2022-JPや、できるだけASCIIと似たような仕組みを作ろうとして複雑な計算を持ち込んだShift-JISなどがある。その後、漢字をはじめとする表意文字については複数言語間で統一の試み(CJK統合漢字)があり状況は改善してきたが、それを取り込んだJIS X 0213やUnicodeのバージョンにしても、以前との整合性を保とうとして首尾一貫しない扱いになっている。それは複数言語間を含んで異体字を包摂して一つの文字コードと定めているものもあれば、すでにJIS X 0208で分離されているからという理由で統合されなかったもの、など。これらは文字コード間の変換を行う際に容易に問題になる。

    本書はこれらの錯綜した状況を明解にまとめて、各文字コードの特徴と問題点をまとめており、非常に役に立つ。まずASCII、ISO/IEC 646、ISO/IEC 8859、JIS X 0201/0208/0212、そしてUnicodeといった様々な規格の様々なバージョンにおける符号化文字集合がどう扱われているのかを個別に述べている。その後、それらの文字コードを実際にどう実現するかの符号化方式としてのShift-JIS、EUC-JP、JIS-2022-JP、UTF-8/16/32などについて述べられる。

    一通り文字コードの説明を終えた後は、Java 6、Ruby 1.8、Ruby 1.9において文字コードがどう扱われていて、どのような問題があるのかが述べられている。ここは正しく把握しないと嵌りそうなところで、プログラマでなくとも重要な箇所。特にJavaでのサロゲート文字と結合文字のStringクラスでの扱われ方は、すでに多くのところで問題になっている(C#など.net系も同じ)。なにせJIS第一・第二標準と第三・第四標準で書いたとき、文字数が変わってしまうのだから(もちろん例外有り)。

    文字コードに興味のある人なら必読の一冊。文字コードの問題は、哲学的にも面白い。制御文字は文字と言えるのか、結合文字に使われる断片は何なのか、言語間をまたいで(特に表意文字において)文字が同じとはどういうことか、等々。

  • 読んで損しない本、プログラマなら知っておくべき内容

  • 文字コードって色々、奥が深い。

  • こないだ文字化け問題でハマったので概要だけおさらいのために。マニアックな話が多くて、大半は興味なし。

全28件中 1 - 10件を表示

矢野啓介の作品

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
Joel Spo...
デール カーネギ...
白石 俊平
エリック・リース
有効な右矢印 無効な右矢印

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)を本棚に登録しているひと

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)を本棚に「いま読んでる」で登録しているひと

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)を本棚に「積読」で登録しているひと

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)の作品紹介

Unicode、JIS規格の今、文字コードの原則、文字化けのメカニズム、コード変換の基礎…ソフトウェア技術者をおもな対象として、文字コードの基礎知識を筋道立てて説明した技術解説書。

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)はこんな本です

ツイートする