[ トップページ ]

メイン

検索・抽出・組織化 アーカイブ

0001-01-01

ChronoSearch.png このカテゴリーには情報の検索・抽出・組織化に関する話題をあつめています. Web の検索に関してはWeb 検索とその応用というページもあるので,参照してください. 私自身,検索の仕事をしていたこともあるので,それにちかい話題もあります. 上位のカテゴリーは 計算・プログラミング です.

なお,このページは検索・抽出・組織化アーカイブ のページの先頭に表示されるように,意図的に投稿日時を 0001-01-01 00:00:00 としてあります (実際の投稿日時は 2007-11-03 19:45 です).

おもくなるのをさけるためにアーカイブのページには写真がはいらないようにしていますが,個別ページにある写真をここに引用しておきます.

WASSad.jpg

2007-04-26

いろいろな本ですぐれたグラフィック・デザインをみせているリチャード・ワーマンは,情報を組織化する 5 つの基準をしめしています. これらのうちの 3 つがちょうど,私がかつて開発してきた軸づけ検索法の 3 種類の軸に対応しています.

つづく…

2007-06-23

ワーマンの “情報組織化の軸” と軸づけ検索」 に書いたように,私の研究テーマだった 「軸づけ検索」 はワーマンの 「軸」 論と密接な関係があります. いまでも軸にそった情報の組織化は検索された情報を直観的に理解できるようにするために重要な方法だとかんがえています. しかし,どうも 「軸」 にそった組織化というかんがえかたが,おもったほどうけいれられていないようにおもわれます.

つづく…

2007-08-15

買いものをするとき,よく楽天をつかっていますが,その理由は私がかつて研究していた 「軸づけ検索」 と関係があるようにおもいます. もしかすると,そこに 「軸づけ検索」 を普及させるためのヒントがあるかもしれないので,すこしかんがえてみることにします.

つづく…

2007-09-09

あふれる情報のなかから,ほしいもの,必要なものをどうやって選択するかということは,情報化がすすんだ現代におけるおおきな課題です. 情報の選択のしかたとして情報源を単位として選択するやりかたがあります. 情報源というのは,特定のひと,特定の新聞・雑誌・放送局などです. ここでは情報源としての “ひと” に焦点をおいて,情報源の選択についてかんがえてみます.

つづく…

2007-09-11

情報源の選択 ― “ひと” の選択を中心として」 において,バラバラの情報を検索することと情報源を検索することとの差にふれました. また,「空間内に配置した情報源からの選択とナビゲーション」 においても情報源の検索についてのべました. しかし,そこで気づかなかった非常に重要なちがいが情報検索と情報源 “検索” とのあいだにあることがわかりました.

つづく…

2007-09-09

あふれる情報のなかから,ほしいもの,必要なものをどうやって選択するかということは,情報化がすすんだ現代におけるおおきな課題です. 情報の選択のしかたとして,「情報源の選択 -- “ひと” の選択を中心として」 に書いたように情報源を単位として選択するやりかたがあります. 情報源というのは,特定のひと,特定の新聞・雑誌・放送局などです. ここでは情報源を 1 次元空間や 2 次元空間に配置して,その空間内を移動しながら情報源を選択するやりかたについてかんがえてみたいとおもいます.

つづく…

2007-09-15

博物館あるいは展覧会というものと検索エンジンとのあいだに類似点をみることができます.

つづく…

2007-09-19

Web 2.0 的な世界においては,既存の知識を参照して,あたらしい知識をそれにつみかさねたり,それをあたらしい知識に発展させていくことが重要です. 本のように活字であらわされた知識のばあいは,その本のどこに記述されているかをページ数や行数によって指定することができます. テレビ番組のような動画によって表現されている知識においても,その一部を指示したり検索したりする機能を開発する必要があるとかんがえられます.

つづく…

2007-10-08

私は以前,検索結果を整理されたかたちで出力してくれる,軸づけ検索という検索法を研究していました. いったんはテーマ検索 (テーマ年表検索,テーマ地名検索) という名のもとで製品化されたものの,いまはつかえなくなってしまいました. しかし,佐々木 俊尚 の情報収集法に関する最近の本から,私がそこで意図していたことがジャーナリストのニーズにあっていることを知ることができました.

つづく…

2008-04-24

私はかつて,世界大百科事典の検索法の開発を仕事としていました. 当時はいつも PC のドライブに世界大百科事典の CD-ROM や DVD-ROM をいれていました. それなのに,この百科事典をひくことはまれでした. ところが,いまではしばしば Wikipedia をひいています. いまや不可欠な道具になっているということができるでしょう. PC のドライブにははいっていませんが,世界大百科事典もいまでもつかえます. それでも,いまもやはり,つかうことはまれです. なぜこうしたちがいが生じるのでしょうか?

つづく…

2008-05-23

2 つの語をくみあわせて Google などで検索するととてもおもしろい結果がでることがありますが,「ビニールハウス」 と 「温暖化」 もそういうくみあわせのひとつです. 検索の意図は 「ビニールハウス栽培は温暖化を促進するか防止するか?」 という問題のこたえをさがすことでした. 当然のように yes と no の両方のこたえがみつかりますが,予想していなかったおもしろい検索結果がありました.

つづく…

2008-05-24

Yahoo! はもともとディレクトリ検索のサイトでした. キーワード検索の Google とディレクトリ検索の Yahoo!,それぞれのつよみをいかして,きそいあってきたはずでした (「検索の方法」 参照). ところが,Yahoo! のディレクトリがそのホームページにしめる位置はどんどん低下して,ついにホームページ (http://www.yahoo.co.jp/) からはおいだされてしまいました. いまでも日本では Google より Yahoo! のほうがアクセスがおおいということですが,つよみをうしなった Yahoo に,どうしてアクセスするのでしょうか? 私にはわかりません.

つづく…

2008-12-12

軸づけ検索 (テーマ検索) については 「ワーマンの “情報組織化の軸” と軸づけ検索」 という項目でも書いた. 2004 年までは 「ネットで百科」 で軸づけ検索をためすことができたが,現在はためせなくなってしまった. しかし,マイペディアのテーマ検索がためせる CD-ROM 製品 「発見ナビ」 は中古品が手にはいったりするらしい (「オヤジと神戸: 年末の無駄遣い」).

つづく…

2008-12-13

私は 1998 年ころ 「軸づけ検索」 という検索法を研究していた. 軸づけ検索の公開されたサービス (「ネットで百科」) では世界大百科事典だけが検索できた. しかし,プロトタイプにおいては,研究用に使用することができた毎日新聞の記事検索もためすことができた. 「軸づけ検索法 -- 文書からの抜粋を抽出・整理して出力する全文検索法」 という論文で使用した例をつかって,毎日新聞の記事から半導体の歴史を知る検索例を紹介したい.

つづく…

2004 年でサービス終了してしまったが,それまで 「ネットで百科」 では 「軸づけ検索」 という発見的な検索法をためすことができた. その機能をつかってチーズが世界のどこでつくられ,たべられているかを知る検索をいまも工学院大学の講義で例としてつかっているので,それをここで紹介したい.

つづく…

2004 年でサービス終了してしまったが,それまで 「ネットで百科」 では 「軸づけ検索」 という発見的な検索法をためすことができた. その機能をつかった赤穂浪士の年表をつくる検索をいまも工学院大学の講義で例としてつかっているので,それをここで紹介したい.

つづく…

軸づけ検索 (テーマ検索) は私が 1999 年ころまでやっていた研究テーマである. もう時期的にはふるくなってしまったともいえるが,その成果はいまも価値があるとかんがえている. しかし,この検索法のことは十分ひろまっていない. そこで,ここではその例のひとつとして,「軸づけ検索法 -- 文書からの抜粋を抽出・整理して出力する全文検索法」 という論文にも書いた流域面積の検索について,あらためて書いてみたい.

つづく…

2009-04-17

たまたまみた Technorati のページで 「京大開発の 「年表型検索エンジン」、小中学生向けサイトで公開」 という記事をみつけてドキッとした. 「年表検索」 は 「時間軸による検索」 などとともに 「われわれのもの」 だとおもってきたのに,「時間軸」 につづいて,とられてしまったからだ.

つづく…

2009-05-02

特定の出版社に関する本をさがしたいとおもって,適切な方法がないかさがした. つまり,その出版社が出版した本をさがすのでなくて,その出版社について書かれた本をさがすということである. これは,おもったよりずっと困難であることがわかった.

つづく…

2009-08-21

2 年前に Windows Vista 用に Shuttle のベアボーン SS30G2 を買ったが,今度は Windows 7 をのせてメモリ上での日本語版 Wikipedia 検索をためすために,搭載メモリが最大で 16 GB の V3-P5G45 というマシンを買った.

つづく…

2009-09-18

私が以前研究していた 「軸づけ検索」 は,最近はときどきみかける結果を年表のかたちにする検索の一種を実現していた. 検索の単位は文ないしそれより細粒度の単位 (句点のあいだなど) だったが,検索結果を表示するときにはまず文章のタイトルを表示していた. ところが,最近あるひとから,タイトルが先頭ちかくにあるのはじゃまだという意見をきいた. これは目からウロコの意見だった.

つづく…

2009-09-21

Google (グーグル) の研究者が書いたいくつもの英語の論文を日本語でまとめている. 専門的な内容の論文をできるだけわかりやすく解説している. Google のしくみに興味はあるが原論文を読もうとはおもわないひとにはよい本である. ただし,Google は現在の検索アルゴリズムについてはあきらかにしていないので,どちらかといえば周縁的な内容だということができる. しかし,検索技術だけが Google のすごさでないことはもちろんであり,知るべきことがいろいろ書いてある.

評価: ★★★☆☆

関連リンク: Googleを支える技術@ [bk1]Googleを支える技術@Amazon.co.jp

つづく…

2009-11-04

Wikipedia をネタにして 「軸づけ検索」 をひろくためせるようにしたいというおもいは,ずっとまえからあった. 「Windows 7 製品版のインストールと 10 GB メモリによる日本語 Wikipedia 全体の検索」 などの項目に書いたように,ようやくそれにちかいことが実現しようとしている.

つづく…

メモリ上での Wikipedia 検索と Windows 7 をめざした,あたらしいマシン」 という項目で Windows 7 のマシンをたちあげて,Wikipedia の検索をこころみていることを書いた. 最近,Windows 7 は製品版にのせかえ,Wikipedia 検索はやっと全体を検索できるところまできた.

つづく…

2009-11-21

竹内 正浩 の 「日本の珍地名@Amazon.co.jp」 (文春新書) は,「人間をまどわす地名,コンピュータをまどわす地名,… ― 竹内 正浩 著, 「日本の珍地名」」 という項目に書いたように,区別しにくい地名,まぜこぜの地名,まぼろしの地名など,さまざまな珍地名について書いている. そのなかでもとくに地名のあいまいさに関する記述は,テキストからの地名抽出をこころみたことがある身にはとくに興味ぶかいこれから地名抽出や地名検索のプログラムを開発しようとしているひとにはとくに参考になる本だ

つづく…

2009-12-13

Wikipedia 「軸づけ」 検索のインターネット上でのサービスをめざして」 などで予告してきた Wikipedia の試行サービス WASS (Wikipedia Axis-Specified Search) をきょう,開始した.

つづく…

2037-01-01

WASSad.jpg
WASS (Wikipedia Axis-Specified Search) (Wikipedia の検索エンジン)

カテゴリー

Creative Commons License
このブログはつぎのライセンスで保護されています. クリエイティブ・コモンズ・ライセンス.