カルチャロミクス：文化をビッグデータで計測する [Kindle]

著者 : エレツ・エイデンジャン=バティースト・ミシェル阪本芳久

草思社 (2016年2月18日発売)

4.50

本棚登録 : 17人

感想 : 1件

サイトに貼り付ける

本ページはアフィリエイトプログラムによる収益を得ています

Amazon.co.jp ・電子書籍

感想・レビュー・書評

並び替え

いいね順
新着順

表示形式

リスト
全文

表示件数

絞り込み

bluesky1981さんの感想
フォロー不許可

2018年12月4日

最終的には二〇〇九年の夏に、われわれのグループに加わっていたユーアン・シェンがこれらの手法とソフトウェア技術者としての自らの才能を組み合わせ、グーグル・ブックスのビッグデータの「汚れ」を取り除くためのアルゴリズムを完成させた

特許の特定技術の検索もノイズを綺麗に取れないか、日々模索しています。イメージは以下の通りです。まずは適当に数件見積もる、数件の共通するIPCなどのタームを抽出する、タームで検索する、検索して出てきた特許から特定技術に関連する用語を抜き出す、用語とタームで検索する。

どれが難しいかって用語の抽出です。テキストマイニングの知識があれば、上手く抽出できるのでしょうか。そもそも、こんなの自分だけでやり切れるものなのでしょうか。で結局、自分で作った類語辞典とタームリストの掛け算で検索しています。

上記の検索ではノイズがそれなりに見受けられます。ただ、ノイズ数の妥当性も定かではありません。100件ならいいのか、10件ならいいのか。

こんな感じで手探りの日々です。

0

詳細をみる
コメント0件をすべて表示

全1件中 1 - 1件を表示

著者プロフィール

エレツ・エイデン(Erez Aiden)
2010年にハーバード大学とマサチューセッツ工科大学（MIT）で博士号取得。数年間、ハーバード大のソサエティ・オブ・フェローズ、Google社の客員研究者をつとめた後、ベイラー医科大学とライス大学の助教に就任し、そこでゲノム・アーキテクチャー・センターを率いた。2009年にはMITテクノロジー・レビュー誌が選ぶTR35（最もイノベーティブな35歳以下の35人）のひとりに選ばれた。2012年には、合衆国政府が若手研究者に与える最高の栄誉であるPECASE賞を、ホワイトハウスより受けた。この賞は、共同研究者と共にゲノムの三次元構造を調べる技術を開発したことに対して与えられたもの。ヒューストン在住。

「2019年『文庫カルチャロミクス』で使われていた紹介文から引用しています。」