2004年12月01日

RSSリーダーに登録可能なRSS Feedの数

Witha SystemからHepCatというRSSリーダーがリリースされているのですが、
「BlogWriteIIとHepCatIIの検討」という記事によりますと、
なんとHepCatでは1800件以上のRSS/Atom Feedを登録してテストしているようです。

これはすごい。

Heimdallrは200件位のRSS/Atom Feedを登録してもそれなりに快適に動くようにはしてありますが、1800件というのは桁が違います。Heimdallrにこんなに登録したこともありません。恐らく1800件のRSS/Atom Feedを快適に閲覧することはできないでしょう。

でも一番興味があるのは、1800件も登録してどうやってたら快適に閲覧できるのか、ということではなく、1800件も登録して何をするのか、ということです。

これはHeimdallrで200件登録できるようにして気が付いたことなのですが、多数のRSS/Atom Feedクライアント型RSSリーダーに登録できても特に嬉しいことはないのです。

なぜ何も嬉しいことがないのかと言いますと・・・。
まず、RSS/Atom Feedが多数あると、記事の数は莫大になり、とてもじゃないですが全部見ることはできません。よってRSSリーダーが備える記事抽出機能により記事を幾つか抽出して見ることになります。

ということは、多数登録できて嬉しいのは、抽出の元となる記事の数が多いから、ということになります。
しかし、残念ながら記事の多さにかけては、BulkfeedsのようなRSS検索エンジンの方が遥かに上です。
それもそのはず、BulkfeedsはRSS/Atom Feedの登録件数が違います。
Bulkfeedsのトップページにはこのようなことが書いてありました。

2004/12/01 00:26 現在 496,346 件の RSS が登録され、4,098,715 件の item がインデクスされています。
496,346件ですか・・・。Heimdallrの200件やHepCatの1800件と比べるとだいぶ桁が違いますね。

もちろんクライアント型RSSリーダーに数十万件ものRSS/Atom Feedを登録できれば良いのですが、登録可能な数が多いHepCatでさえ1800件。さすがにこの数は無理でしょう。

つまり、クライアント型RSSリーダーに登録可能なRSS/Atom Feedの数は、読むには多すぎ、そして記事を抽出するには少なすぎるという、中途半端な数なのです。
そのため、RSSリーダーに数百や数千件程度登録して頑張ったところで、RSS検索エンジンで難なく代替できてしまいます。
だから、クライアント型RSSリーダーに多数のRSS/Atom Feedを登録できても嬉しくないわけです。

一応Heimdallrは、自動学習とキーワード検索により、多数の記事の中から興味がありそうな記事を抜き出す機能を備えています。私は一応この機能を有効に活用していると思うのですが(開発者ですし)、それでも、残念ながら、RSS検索エンジンの方が質の高い記事を抽出できている気がします。

だからたぶんHeimdallrが備えている程度の記事抽出機能だけではダメなのです。
何か他のものが必要なのです。しかし、それが何なのか私には分かりませんでした。HepCatを開発されている方にはそれを見つけて欲しいと思います。

ちなみにHeimdallrは今後この課題についてどうするかといいますと・・・。
私としてはRSS検索エンジンの方が得意なことはRSS検索エンジンにやってもらえばいいじゃないかというスタンスでして。RSS検索エンジンができないことをHeimdallrでやって、それでかつRSS検索エンジンと連携してなんちゃらしちゃえばいいんじゃないかなとか。いやまあ詳しくはChannelExtensionが形になってから、ということで。

投稿者 MASATO : 2004年12月01日 00:26 | トラックバック
コメント

耐久テストをして頂きどうもありがとうございました。

耐久テストに関するコメントは以下のURLにまとめて書いておきます。
http://www.sutosoft.com/room/archives/000103.html

Posted by: MASATO : 2004年12月04日 18:36

heimdallrいじめ第二弾
今度はビューを100個開いちゃうぞ~~。
勝手にheimdallrをオモチャにしてごめんなさい。

結果
またまた普通に動作
気になった点としては
・圧縮されているスキン使おうとすると同じスキンを使用する場合でもビュー毎に解凍している感じ…いったん解凍した後に使い回せないのかな?
・スキンも登録サイトも同じだとビュー設定見るまでどのビューなのか判らない。

ビュー設定を複数ビュー纏めて変更できるのには感動しました。
ビュー毎に表示条件とか設定できれば
たとえ2万件登録していても日替わりで表示するビューを変更することでそれなりに使えるかも、とか思っちゃいました。

Posted by: 瞳子 : 2004年12月03日 17:39

2万件登録してもheimdallrは普通に動作しました~。

問題点かなと感じたのは
・インポートするときに重複登録ができてしまう。
・インポートしてからビューに2万件登録するのが大変(既読ボタンのようにざば~っと登録したかった。)
・サイトが多いとビューに追加削除するのが大変(ビュー設定の部分に表示の絞り込み機能が欲しいかも)
・ビュー毎に自動更新時間を設定したい(一気に2万件アクセスしに行くのは無茶でした。)
ビュー右クリックの(最新の情報に更新)だけでもそのビュー単体だけの更新に出来ませんでしょうか?
ビューに登録していない記事に関してはチェックに行かなかったところが流石だと思いました。

2万件インポートするのに費やされた時間は
同時アクセス10の設定で27分10秒でした。

Posted by: 瞳子 : 2004年12月03日 13:14

RSS作成CGIできました~。

http://heimdallr.info/wiki.cgi?page=heimdallr%A4%CE%B8%C2%B3%A6%A4%CB%C4%A9%C0%EF

これで、いつでも簡単にRSSリーダーの限界に挑戦できます。

1つのRSSには14件の記事が含まれて~
そんなRSSを10の二十乗個まで作れます。

桁が違うと言われたら黙っていられないただの馬鹿です。

Posted by: 瞳子 : 2004年12月02日 18:18

ここで、瞳子の出番ですね(ぇ
RSS大量生産のスクリプト書いて~一気にヘイムダルにインポートしてみます。
その登録数2万!!
もちろん全部ローカルサーバーからのダウンロードにするのでインターネットには迷惑かけません。
結果は後ほどご報告しますね。

そういえば、いつのまにかheimdallr.infoに書き込みされていて驚きました。

Posted by: 瞳子 : 2004年12月02日 17:51

コメントありがとうございます。

> それを解決するには、結局、自分と似た興味を持ち、かつ早耳で頭いい人のブログを登録しておく、というのが一つの方法かなと。つまり、「人」を利用した情報
抽出ということです。
サーバ側サービスとしても、抽出記事の質を向上させていく取り組みが色々と行われていくと思います。単純なキーワード一致だけに拘らないサービスも色々と増えて行くでしょう(未来検索livedoor(http://sf.livedoor.com/)の「似ている記事を探す」など)。油断していると、こうしたサービスの方が簡単に「自分と似た興味を持ち、かつ早耳で頭いい人のブログ」を見つけられるなんてことになりかねません。

こうしたサービスに負けない、クライアント側で動くからこそ実現できるサービスを見つけて頂ければと思います。

Posted by: MASATO : 2004年12月01日 20:07

こんにちはBlogWrite担当です。

>1800件も登録して何をするのか、ということです。
いやぁ、我ながら笑ってしまいました(笑

書いたように、テストも兼ねてるわけですが、まぁ、新しい発見をするためでもあります。
私も各種検索エンジンかなり便利に(負荷かけないように分散して^^;)利用して、その検索結果は登録していますけれど、検索エンジンではすでに知っているキーワードにまつわる情報が取っ掛かりになりますので(超便利ですが)、自分のまったく知らない情報を取得する機会を得るには、結局検索エンジンには頼れないんではないかなと。

それを解決するには、結局、自分と似た興味を持ち、かつ早耳で頭いい人のブログを登録しておく、というのが一つの方法かなと。つまり、「人」を利用した情報抽出ということです。

その人を見つけるには多数のRSSを登録しなければわからないわけですが、そのうち減っていくんではと思います。

と、開発者らしくないアナログな考えですが、リアルな人間関係でも似たような事が起きているんじゃないかなぁと思います。

Posted by: BlogWrite担当です : 2004年12月01日 03:25
コメントする









名前、アドレスを登録しますか?