プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)

  • 640人登録
  • 4.09評価
    • (38)
    • (34)
    • (27)
    • (1)
    • (0)
  • 28レビュー
著者 : 矢野啓介
  • 技術評論社 (2010年2月18日発売)
  • Amazon.co.jp ・本 (400ページ)
  • / ISBN・EAN: 9784774141640

この本を読んでいる人は、こんな本も本棚に登録しています。

有効な左矢印 無効な左矢印
デール カーネギ...
濱野 純(Jun...
白石 俊平
有効な右矢印 無効な右矢印

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)の感想・レビュー・書評

  • 文字集合と符号化方式の違いすら意識していなかった自分でも、本書を読むことで一から文字コードの基本と、それにまつわる問題を理解することができた。

    とっても丁寧に細かいところまで解説してくれているし、完璧とまではいかないにしろ、これさえ読めばエンジニアが通常理解しておくべき文字コードの知識は習得できると思う。買った目的を文句なしに達成できた本。

    それにしても、今まで文字コードをないがしろにしていた自分が恥ずかしい。理解できた今となってはかなり違った景色が見える。

  • 体系的に書かれていそうだったので、買ってみた。

  • nkf iconvなどの文字コード関連ツールの存在が再認識。
    ascci 7ビットの1バイト

  • 請求記号 007.63/Y 58

  • 仕事で文字コードを気にしないといけない場面がちょくちょくあるけど基礎知識がないので読んでみた。
    ASCIIから始まる文字コードの歴史と代表をわかりやすくまとめてある。一通り読んだけど、職場に置いて困ったことがあったら参考にしよう。
    個人的には汎用機にも関わるから、すっぱりカットされたEBCDICも解説して欲しかったけど。

  • ミャンマーで使われている文字セットについて理解するためにだいぶ前に購入。EmojiのUNICODEへの取り込みを契機に再読する。
    計算機のリソースに余裕がうまれた今の時代に、文字は減らしてはならないとおもった。

  • 文字コードにまつわる基本的知識について、実にうまくまとめられていて読んでいて楽しい。プログラマのための、とタイトルにあって、実際JavaやRubyでの文字コードの扱い方を書いた一章があるが、それ以外の内容は特にプログラマ向けではない。文字をどうやってビット列・バイト列で表現するかは特にプログラマに限った話でなく、文字コードという発想そのものがそうした問題なのだから。

    文字コードの世界は実に複雑怪奇。もともと表意文字を多く用いる日本語などの言語をまったく考慮せず、アルファベットといくつかの記号くらいで定義されたASCII(それでも英語圏以外では早くも苦労したわけだが)から始まった文字コードは、様々な国や様々なグループで独自の発展を遂げている。発展の中では、当時メモリやネットワーク帯域が小さかった故に、工夫をして複雑になっているJIS-2022-JPや、できるだけASCIIと似たような仕組みを作ろうとして複雑な計算を持ち込んだShift-JISなどがある。その後、漢字をはじめとする表意文字については複数言語間で統一の試み(CJK統合漢字)があり状況は改善してきたが、それを取り込んだJIS X 0213やUnicodeのバージョンにしても、以前との整合性を保とうとして首尾一貫しない扱いになっている。それは複数言語間を含んで異体字を包摂して一つの文字コードと定めているものもあれば、すでにJIS X 0208で分離されているからという理由で統合されなかったもの、など。これらは文字コード間の変換を行う際に容易に問題になる。

    本書はこれらの錯綜した状況を明解にまとめて、各文字コードの特徴と問題点をまとめており、非常に役に立つ。まずASCII、ISO/IEC 646、ISO/IEC 8859、JIS X 0201/0208/0212、そしてUnicodeといった様々な規格の様々なバージョンにおける符号化文字集合がどう扱われているのかを個別に述べている。その後、それらの文字コードを実際にどう実現するかの符号化方式としてのShift-JIS、EUC-JP、JIS-2022-JP、UTF-8/16/32などについて述べられる。

    一通り文字コードの説明を終えた後は、Java 6、Ruby 1.8、Ruby 1.9において文字コードがどう扱われていて、どのような問題があるのかが述べられている。ここは正しく把握しないと嵌りそうなところで、プログラマでなくとも重要な箇所。特にJavaでのサロゲート文字と結合文字のStringクラスでの扱われ方は、すでに多くのところで問題になっている(C#など.net系も同じ)。なにせJIS第一・第二標準と第三・第四標準で書いたとき、文字数が変わってしまうのだから(もちろん例外有り)。

    文字コードに興味のある人なら必読の一冊。文字コードの問題は、哲学的にも面白い。制御文字は文字と言えるのか、結合文字に使われる断片は何なのか、言語間をまたいで(特に表意文字において)文字が同じとはどういうことか、等々。

  • 読んで損しない本、プログラマなら知っておくべき内容

  • 文字コードって色々、奥が深い。

  • こないだ文字化け問題でハマったので概要だけおさらいのために。マニアックな話が多くて、大半は興味なし。

  • 日本語の文字コードについての基本的な知識がひと通り学べる。いくつかのOSで文書を作成したり、趣味でプログラミングをする程度であればこの本で十分だと思う。

    全体を通して興味深くわかりやすい内容ではあるが、3章までは聞き慣れない言葉や規格がたくさん出てきて読んでいていまいちピンとこない人も多いはず。ただ、そこまでの流れをしっかり読んでいれば、Shift_JIS、EUC-JP、UTF-8 などの馴染み深い文字コードの説明がなされる4章で多くのことに納得がいってスッキリする。この本を手にとったら最低でも4章の終わりまでは絶対に読んでほしい。

  • 前半は文字コードの歴史や規格について、かなりのボリュームが書かれている。

    中盤以降はより実践的な内容。JavaとRubyを代表例として、実際の文字列処理と他言語対応の仕組みについて詳しく書かれている。また、トラブルとなりやすい事例と、その対処方法も広くカバーされている。

    プログラミングをする上でとても重要となる文字コード。常に手元に置いておきたい一冊。

  • F転やDBとの連携関連のところで役に立ちました。
    外字や特殊文字が文字コード毎に変換テーブル違ってたりするとか知らなかったです。
    都度参照すればよいので、詳しく覚える必要は無いですが、SEとしてはいつも持ち歩いておきたい本です。

  • ここまで文字コードについて詳しく書かれた本は初めて読みました。文字コードに少しでも興味のある方にお勧め。

  • 普段何気なく使っている文字列のエンコーダ/デコーダがどんな処理をしているのか概要をつかめる。コードポイントや波ダッシュ問題にも触れていて、Java触っている人は読んでおいて損はしない。

  • 120216 とりあえず必要なところだけ読了
    120513 紙の本を自炊してPDF化

  • テキストとはバイト列の集合だということが理解できる本。
    そのバイト列をどの単位で解釈し文字に割り当てるかということが文字コード。
    普段何気なくタイプしている文字だが、いまや当たり前となっている文字入力、日本語入力だがそういうコンピュータの低レベルな処理の仕組みや、歴史、知識などが學べてこれはプログラマーでなくても知っておくべき、まったく損のない知識が詰まっている。
    当然のように入力している日本語だが、実にやっかいで大変なものなんだなと認識させられます。

    満足の星5つ。

    文字コード以外に、予備知識として日本語の国語国字の歴史も知っていたほうが漢字の問題も理解しやすいと思います。自分は以前から既知の問題だったので大丈夫でしたが、そこらへんの知識がないとなんで漢字が数種類あるんだろう?っていうのが理解できないと思います
    おすすめの書籍は『旧字力、旧仮名力 (生活人新書) 青木逸平』と『旧字旧かな入門 (シリーズ日本人の手習い) 府川充男、小池和夫』の二冊です。これで戦後の国字改訂の問題が學べると思います。
    書籍を購入しない場合はネットで「当用漢字」や「朝日文字」などを調べてみるのもいいかもしれません。今使っている漢字(活字)のいくつかは正字(康煕字典に基づく字、いわゆる旧字)を省略したものです、新字というやつですね。有名なのは榮倉奈々ちゃんの榮(栄)とか。

    個人的には83JISの改訂は余計だったなと感じています。そのせいで未だに掴むのつくりが国だったりね(本来は國(摑))…、朝日文字は嫌いです

  • 和図書 548.96/Y58
    資料ID 20111034764

  • プログラマのための~とあったのでソースコードがツラツラでてきたりするのかと思っていたら、文字コードの成り立ちや仕組についての説明が多かった。前半部分は読み物として面白かった。
    処理に関して具体的にコードなどの詳細が書かれていたのはJavaとRuby1.8/1.9

    文章はわかりやすくまとめられているが後半に行くにつれて内容はむずかしめに感じた。全部理解するには少しずつ読み進める必要があると思うが、UTF-8とかUnicodeとかなんなの?という疑問を解決したい人にはオススメ

  • 今まで避けてきた文字コードについて、改めてわかりやすく解説されていてよかった。良書。

  • 一度ちゃんと勉強しておきたいと思ってた文字コードの入門書。この本一冊で日本で主流の文字コード(JIS、SJIS、EUC-JP、ISO-2002-JP、Unicode)は十分にわかる。

  • 主にソフトウェア開発者向けの文字コードに関する技術解説書です。
    文字コードの歴史、各種文字コードの規格、Webやメールの文字コードの注意点、プログラムを書く時の注意点などをかなり詳しく書いています。間違いなく現在日本語で読める文字コードの解説書としてはベストだと思います。

    かなり詳細に書かれているので、詳しく知りたいという人に向いていると思います。ただ、文字コードの基礎を知りたい人はもっと入門書を読むと良いでしょう。

  • なんとなく理解しているつもりだった、文字コードの中身をきちんと理解できた。概要ではなく、具体的なコード値の例等で説明されているため、正確に理解できて良い。

    文字セットとエンコーディングが別のものであることを、理解することがポイントだと感じた。

    購入当初は、新宿の紀伊国屋で1位になっていたのも頷ける。
    プログラマは必読だと思う。

  • 各方式の詳細がメイン。
    文字列処理を行うときのノウハウが欲しかった。

全28件中 1 - 25件を表示

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)を本棚に登録しているひと

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)を本棚に「読みたい」で登録しているひと

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)を本棚に「いま読んでる」で登録しているひと

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)を本棚に「積読」で登録しているひと

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)の作品紹介

Unicode、JIS規格の今、文字コードの原則、文字化けのメカニズム、コード変換の基礎…ソフトウェア技術者をおもな対象として、文字コードの基礎知識を筋道立てて説明した技術解説書。

プログラマのための文字コード技術入門 (WEB+DB PRESS plus) (WEB+DB PRESS plusシリーズ)はこんな本です

ツイートする