むつの日記

fa4f9958 むつ 2005-05-24 20:00
[Linux][Rast][Iron33][Crawler][検索]
オープンソース Web 検索エンジン + クローラーとしては nutch が有名ですが、進展がなさそうなので、
日本製のオープンソースの、クローラー Iron33 と 全文検索 Hyper Estraier を使って Web 検索もどきをつくってみました。
Iron33 は昔使いかたが分からず挫折したのですが、何故か今回は分かりました。
Iron33 はソースコードのミスとインクルードファイルの移動(?)がありますので、ちょっとだけ修正が必要です。
usage 表示部分2ヶ所(どこだか忘れました) \n\ が抜けています(\ だけでもいいけど。改行コードのエスケープミス)。
off_t を使う部分1ヶ所、#include <sys/types.h> 追記。

感想。
なかなかいいかんじです。ただ、Iron33 のインデックスはよくわからないので、
付属のプログラムでいったん展開してからあらためて、Hyper Estraier でインデックスを作っています。
Iron33 でクロールしたキャッシュを直接読んでいないので、Hyper Estraier のインデックス差分登録はできないでしょう。
ですので、展開する時間 + その分の HD 容量 + インデックス作成時間(たぶん、常にイチから作るはめに)がたいへんな事になります。
それと、あまりに一般的な語彙だとニュースにばかりヒットします(Linux とか)。
Google のページランクとか、そういった仕組みが欲しいところです。分量多いので。
Web ページ全体は諦めて(nutch に期待。だれか日本語専用 fork 作らないかな……)RSS や Atom に対象をしぼった方が現実的で今風かもしれません。
Web ページ全体だと、HD 容量の問題もあり個人ではすぐに壁にぶち当たるのも目に見えていますし。
P2P 的にみんなで協力とかしたいな……。あー、海外ではあるんですよね、YACY とか GPU とか。
どちらも日本語は無理でしたが(クロールのしかたも分かりませんでした)。
400882a6 anonymous 2005-05-24 23:19
>>e01f3987
よく見たらPerlのところはsedで書けるような気がする。
awkだともっと短縮できるかも。
言うだけ。

Tips:
インストール前後に find /usr/local \! -type d とかやって差分を取ると、
どんなファイルをインストールしたかわかる。
a4c4ead9 anonymous 2005-05-25 08:09
>>400882a6
sed では改行コードを消す処理が書き難いので perl にしました。
(スクリプト中で実際に改行すればいいだけだといわれれば、そうなんですけど)。
awk はさっぱりです。

Tips は知りませんでした。ありがとうございます。
一応、find /usr/local -newer log/hogehoge.log なんて処理を入れようかと思いはしたのですが、
これだと、余計なファイルまで見つけてしまうのでやめにしました。
#installwatch や install.log(?) のような専用のプログラムでも走らせようかとか考えていました。
99c579e1 むつ 2005-05-25 20:55 1117022128.gz (4KB)
Distributed DNS
http://distributeddns.sourceforge.net/

というのを(だいぶ前に)見つけたのですが、遊び方が分かりません。
DNS サーバとして振る舞うとか、http/socks Proxy になるとかしないと意味ないような……。

分かる方いましたら、教えてください。
mutumin.ddo.jp:1055 で動かしてみてます(server.xml のbootstrap を変えてみてください)。

というだけではなんなので、ddns.system.DDNS の引数の処理が素人目にはおかしく感じたので、
自分なりに修正したのをアップしてみます。
改行コードが CR+LF でしたのでパッチではなくファイルそのものです。
まぁ、パッチでも平気でしょうが。
ファイル名: DDNS.java.gz
467dff09 むつ 2005-05-31 18:31
>>99c579e1
>>1afb9190

使いかたわからないのであきらめ。
cbd292a4 むつ 2005-05-31 18:33
[nutch][日本語検索]
nutch は 1 文字単位の N-gram 方式なのですんごくノイズが多くなります。
まーそれはフレーズ検索を駆使するとして、日本語以外の検索結果の除去も必要に思われます。
たとえば、「Bittorrent 検索エンジン」を検索したい場合「Bittorrent "検索エンジン"」とすればそれなりの結果は得られます。
「検索エンジン」という日本語が入っていますので、ほぼ日本語のページが引っかかることでしょう。
ですが、「Bittorrent」のしかも日本語のページが欲しい場合はたいへんです。
「ニュース」「記事」「解説」などのワードで&検索すればこの場合良好な結果が得られるでしょうが、
もっと幅広く「Bittorrent」のことばが入ったページを探したいときは……。
昔(といっても 4, 5 年前)Yahoo!Japan で検索するときに、「日本」や「日本語」で&検索した事が思い出されます。
きちんとするなら、日本語の文字コードが含まれているかいないかを調べ、検索結果に反映させるべきでしょうが、nutch に手を入れるのはたいへんです。
そこで、出現頻度が高そうなひらがなで&検索するという方法を思い付いたのですが、出現頻度が高いひらがなって何でしょうね?

http://72.14.207.104/search?q=cache:MZz_IgiUKfQJ:yns.rlki.nu/diary/%3F200011a%26to%3D200011071+%E3%81%B2%E3%82%89%E3%81%8C%E3%81%AA%E3%81%AE%E5%87%BA%E7%8F%BE%E9%A0%BB%E5%BA%A6&hl=ja&lr=lang_ja&client=firefox-a
728382be anonymous 2005-05-31 21:37 1117543063.py (0KB)
>>cbd292a4
手元にある新月のキャッシュを調べてみた結果:

だ: 7673
ん: 7673
も: 7673
よ: 7673

こんな感じだよもん
d0eed929 むつ^H^Hだよもん星人 2005-05-31 23:31
>>728382be
おお、これはかなり有用なデー……って、すごく意味ないだよもん。
長森瑞佳のフラグは何であんなに意地が悪いだよもん?
でも、「ん」は有効かも知れないだよもん。
8375e825 むつ 2005-06-01 23:26 1117635988.txt (0KB)
[nutch][Hyper Estraier][Web 検索エンジン]
nutch の話をしたので、nutch デモを再公開。
http://mutumin.ddo.jp:8080/jp/
ポートは変更する予定。上で継らなければ、http://mutumin.ddo.jp:8088/jp/ へ。
回線は細くないのですが、いろいろ動かしているデスクトップ機でのデモですので、
遊んでみる場合はまたーりを心がけてください。
まだ再クローリングはしていないので、キャッシュが古いままです。
明日クローリングの予定。そのときは多分つながらなくなりそうです。3時間くらい?

ついでなので、Iron33 + Hyper Estraier のデモも公開してみます。
http://mutumin.ddo.jp/cgi-bin/estseek.cgi

どちらも、飽きたら停止しますが、ぜひ遊んでみてください。
890b6755 むつ 2005-06-07 23:32
[Hyper Estraier][Web 検索エンジン][larbin][Rast]
larbin + Hyper Estraier のデモです。
http://mutumin.ddo.jp/cgi-bin/estseek-larbin.cgi
インデックス作成をミスってえらい時間がかかってしまいました。
(下位ディレクトリを for 文で取得したり、必要もないのに差分作成にしたり)。

デフォルトで検索結果 100 件表示にするにはどこをいじったらいいですかね?

Rast は SuSE 9.2 じゃうまく動きません。
Debian testing だと問題なく動くのですが。
このバイナリを SuSE に持っていってもダメなので、どこか別のライブラリが悪さしているのかも。
暇をみてバージョンアップしておこうと思います。それでうごけばいいな〜。
dca2e3fe anonymous 2005-06-07 23:35
>>890b6755
> Debian testing だと問題なく動くのですが。
Sargeが出たその日からtestingかよ、このエッチ
e79682db むつ 2005-06-08 19:52
SuSE のアップデートミスって環境壊しました。あっはっは orz
手順通り確認しよう>自分。
この際なので Plamo にしようとしている自分がいます。
(SuSE のインストール CD どっかに消えた。9.3(ftp) もうすぐ出るので新しく作るのは悲しい。debian はサーバ混んでる気がする)。
なんで、nutch と Hyper Estraier のデモは明日以降に再開予定です。

>>dca2e3fe
Sarge 出たその日に upgrade しただけですので、おおよそエッチです。エッチ分 30% くらい。
a2f78d21 anonymous 2005-06-08 19:56
>>e79682db
Debianは意外とサーバは混んでなかったです。
FDイメージで起動してringサーバを選んだ場合ですけど。
cbe88859 むつ 2005-06-10 18:31
>>a2f78d21
d7fbda0a むつ 2005-06-10 18:44
>>a2f78d21
そうでしたか。あ〜 Debian にすればよかったかなぁ……。
CD-R に焼いたこともあって、Plamo にしました。
んで、ATA133Raid な外付け HD が使かえず調べ中(別に Raid 機能は使ってないんですが)。
modprobe ataraid ってやればいいと思ったんですが、そう甘くないようで。

nutch と Hyper Estraier のインデックスはこの外付けにはいっているので、
これが使かえないと再開できません。
とりあえず、カーネルをソースからリビルドしてみます。

#何年かぶりの SKK でミス多発。
7be5950f むつ 2005-06-11 00:31
記憶違いでした。ataraid ではなく、siimage を組み込むべきでした。
RAID では無いのだし。ハマったのは siimage と framebuffer を共に有効にしているとブートしないということでした。
ちょっとぐぐってみると、kernel 2.4.21pre1 + siimae + framebuffer = no boot
なんて書いている人がいました。Plamo 4.02 は kernel 2.4.29 ですが、直ってないのでしょうか?
それと、単純に modprobe siimage とすると、外付け HD を hda として読み込もうとしてエラー多発します。
(昔はこれで出来たような記憶があるのですが……)。
他のディストリでどうやっているのか調べなとなぁ。
とりあえず寝ます。ぐーぐー。
d4a5303b anonymous 2005-06-11 00:35
>>7be5950f
この際2.6カーネル入れれば?
81c3167c むつ 2005-06-11 13:47
>>d4a5303b
0b6b200b むつ 2005-06-11 13:56
>>d4a5303b
ご提案にしたがい、2.6.11.11 にしてみました。
……認識しました。問題無く。何もしなくとも。
……よろこんでおこう。わーい。

調べていませんが、siimage.c にはパッチがあるようですので、各種ディストリビューションはなんかゴニョゴニョやっていたんでしょう。
2.6 で動いたのでもうどうでもいいです。2.4 ステってことで。

なにはともあれ、d4a5303b の名無しさん、ありがとうございます。
21fc5796 むつ 2005-06-11 22:11
[メモ][可逆/非可逆圧縮音声形式]
mp3, ogg, wma, rm(ra), AAC, tta, wv, ape, flac, Musepack, AC3, la, ofr
どれが Linux でも使用可能かは不明。
81925a6c むつ 2005-06-12 20:39
62386f56 むつ 2005-06-12 20:47
↑またミス。いいかげん、ひらがな打った後で Enter 押す癖直さないと。
[メモ][独り言]
新月の応援サイトをどうのこうのいってから、1ヶ月以上経ちました。
この行動力の無さは評価に値します。もちろん、悪い方で。
んで、Rast(全文検索ライブラリ)のコンパイルに成功しました。
html 文書のインデックス中。……すごく時間がかかりそうです。
うまくいけば、小山さんの mod_search_rast を使った検索デモが出来そうです。
52b695b7 むつ 2005-06-13 21:58
Kernel 2.6.11.11 な Plamo で Zaurus の usb 接続が認識しないなぁと思っていたら、
こんな [ http://www.page.sannet.ne.jp/knabe/d/200503c.html ] 話しがあるそうで。
とりあえず、パッチをいただいて対処します。
283551cf むつ 2005-06-14 18:54 1118742892.pl (1KB)
[perl][script][スクリプト][やっつけ]
朔のキャッシュを2ちゃんねるの dat 形式に変換するような気がするスクリプトです。
./cache2dat.pl ~/saku-0.4.0/cache "むつの日記" | nkf -s >1234567890.dat
などと使います。
2ちゃんえる専用ブラウザで見るためには、dat は Shift-JIS の LF、10 桁の数値なファイル名である必要がありそうです。
このスレッドを変換し、pu-roxy と p2 のキャッシュに突っこんだところ見ることができました。

スクプトの中で UTF-8 でベタ書きしている部分がありますので、
このスクリプトの文字コードは必ず UTF-8 にしてください。
nkf --overwrite -w cache2dat.pl

TODO: といってもやらなさそう。
1) body が空だと問答無用で削除伝播書き込みだと判断している部分を
まっとうに remove_* を見るようにする。
2) 添付ファイルに file: か http: でアクセスできるようにしたい。
3) 2ch の read.cgi 相当なものが欲しい(p2 でエラーが出るから)。
-- 0ch script を参考に?
4) list_* から板と subject.txt を作ってみたい。
5) 全キャッシュをいっきに変換できるように。ほとんどオートで。
6) Python に移植。
ま、たぶんやらないです。つーか根性のある名無しさんに丸投げ。

#frost のキャッシュにも使えそうな……。
#無理か? XML の body 要素がすばらしい感じだから。
[[お話聞きました/6faabc9e]] に心動かされて。
8ff50776 むつ 2005-06-15 16:45 1118821507.pl (1KB)
>>283551cf
kita で見れなかったので、少し修正。使う場合はスクリプト中の $baseurl="http://debian-99:8000" を適宜、稼働中の新月 url に書き変えて下さい。
$baseurl="http://localhost:8000" とか。
TODO の 2 をやっつけでやりました。
1 はやる気無し。
3 は 0ch の read.cgi と関連モジュールをそのまま持ってくればやれます。
4 は無理そうなので、手作業で。
5 は 4 で作った subject.txt をもとに、スクリプトまわすかんじで。
(朔にちょっとだけ手を入れて、update をうけとったら、自動でやるようにしたいな。
cron で ./run/update.txt の更新をみはるのは負荷がそれなりにありそうだし)。
6 はまず無理。やりたんだけど。

Win でも Cygwin を入れればできそうだけど、そこまでする人はいないだろうから、
mutumin.ddo.jp で 新月to2ch ブラウザの subject.txt と *dat を提供。
負荷分散のために Coral OR dijjer を利用してください。とかすればよさそう?
まー、書き込みは http://shingetsu.xrea.jp/gateway.cgi をご利用ください。なのだけれど。
(これに関しては、タイトルから該当スレッドにジャンプする cgi でもつくればよさそう。cgi 作ったこと無いけど)。
↑いつもどおりいってみるだけ。

kita と p2 で確認しました。
kita の外部板登録方法は下記のとおり。これって、2ch の前スレにしかのってない。orz

--
 2ch互換外部板登録(暫定)実装

.kde/share/apps/kita/extbrd.confに 板名<>URL 形式で登録。例えば

サッカー実況<>http://livesoccer.net/cgi-bin/12ch/Live/
0ちゃんねるテスト<>http://tolkien.s7.xrea.com/teston/

みたいな感じで。すると板お気に入りの下にextboardという項目が出てきます。あくまで登録できるだけの
暫定実装なんで使い辛いですが本実装は中の人に任せます。あと書き込みとかも恐くてテストしてませんが
大丈夫じゃないかなあ。多分。具体的には関数を一個(KitaBoardView::loadExtBoard)増やしただけ。
-- ここまで

http://pc5.2ch.net/test/read.cgi/linux/1089905503/197 より。
f5a91a2b むつ 2005-06-16 20:51
>>8ff50776
自動更新はまだですが、手持ちキャッシュの 2ch 形式 dat 化は終わりました。
自動更新もなんとなく目途がついたような気がするので、明日やれるかもしれません。

ところで、kita もおちゅ〜しゃも 80 ポート以外で運営されている掲示板は見れないみたいです。
つまり、Coral CDN も無理と。
stone などでポートフォワードしてくれると、おっけーなのですが。
# stone mutumin.ddo.jp.8080.nyud.net:8090 80
とか。めんどくさいですね。

とりあえずこちら。
http://mutumin.ddo.jp/saku/subject.txt

中身がタイトルと一致してないとか、文字化けしてるとか、エラーとか、
○○というスレッドがないとか、ここはこう変更すべきだとか、
むしろこういうのはやらないほうがいいとか、ご意見をお願いします。

>>8375e825
>>890b6755
は url 変更になります。
nutch: http://mutumin.ddo.jp:8088/jp/
Iron + Hyper Estraier: http://mutumin.ddo.jp:8080/cgi-bin/estseek.cgi
larbin + Hyper Estraier: http://mutumin.ddo.jp:8080/cgi-bin/estseek-larbin.cgi
インデックス更新してませんけど。

Rast はインデックス作成中に hdd から溢れたので休止中です。
cabf1e71 むつ 2005-06-16 21:01
>>f5a91a2b
しまった。ブランケットリンクに対応するのを忘れてた。
次の機会にやっとこう。
つーか、スクリプトがかなりおかしいんだよな……。
ファイルの一行目だけみる perl スクリプトってどうやるんだっけ?
9e9c6f0e anonymous 2005-06-16 21:41
>>cabf1e71

open IN, "foo.txt";
$_ = <IN>;
close IN;
print $_;
e1c8fd97 むつ 2005-06-16 22:06
>>9e9c6f0e
ありがとうございます。

自動更新のほうも後は cron に設定すればいけそうです。
更新間隔をどれくらいにするかが悩みどころです。
4fc73f5a むつ 2005-06-17 00:23
不具合めっけた。
>>てすと。
とか書くと、レス番号に変換しようとして失敗する。
該当レス番号がなければあきらめるように書いたつもりなんだけど。
これも明日。
e0416ad6 むつ 2005-06-17 17:02
>>8ff50776
なんとなく使えそうになった気がするので、2ちゃんねるブラウザゲートウェイとかいってみます。

http://mutumin.ddo.jp/saku/subject.txt
http://mutumin.ddo.jp/saku/jump.cgi

cgi の生成 html はかなりいいかげんです。
おかしな所があったら教えてください。直します。

subject.txt 生成スクリプトにもうすこし手を入れたら、公開しておこうと思います。
だらだら書いたのですっごいスパゲティ化してます。設定ファイルも別にしないとな……。
(多分、本人以外使えません。ごちゃごちゃしてるから)。

更新間隔は 10 分毎です。dat 生成にはそれほど時間はかかっていないようですので、
書き込みから 10 分くらいで2ちゃんねるブラウザゲートウェイに反映されることでしょう。
新月の同期が遅れている場合はそのかぎりではありませんが。
新規スレッドは手動での追加になります。24 時間もしくはそれ以上待っていてください。

--
以下テスト
>>1st >>hogehoge >>1 >>10 >>20 >>30 >>40 >>50
[[存在しないスレッド]]
[[/thread/新月作戦会議室]]
--
cab8f928 むつ 2005-06-18 02:15
>>6d87d654
力技で回避。ブランケットも同様。
テスト用書き込みスレ [ http://mutumin.ddo.jp/saku/dat/1076814029.dat ]
のバグは漢字コード変換の副作用。nkf 以外を探してこよう。

他におかしなところがありましたら、教えてください。
#今日は静かだなと思いながら、おやすみなさい。
17b084b9 むつ 2005-06-19 00:03
>>ffef6d78
アップデートスクリプトにエンバグ。ザ・リング見ていたので、遅れました。
漢字コード問題はあきらめるしかないかも。
UTF-8 を Shift_JIS に変換する以上、日本語以外のコードで書かれるとダメポ。
34ed9920 むつ 2005-06-19 23:28
今日思ったこと。
kademlia というか、BitTorrent で使われている khashmir って DHT はおもしろそうだな。
dijjer.org に手を入れて、Coral のような Web Cache Server に出来ないかな?

DHT で P2P 掲示板を Tomo さんのサイト [ http://homepage3.nifty.com/toremoro/ ] を見ながら考えていたのですが、
ノードが持つキャッシュの正当性は誰が保証すんだ? ってところで思考停止しました。
新月では最新の書き込みは即座にブロードキャストされるので、改竄のヒマがない、
古い書き込みに対しては「あきらめる」ということだと理解しています。

DHT では削除も問題になります。
例えば、各スレッドを各ノードが管理していた場合、レスの削除をうかつには行なえないと思うのです。
(○○というスレッドを管理しているノードを××管理ノードと呼ぶことにします)。
削除したいレスというのは大きく分けて2つありそうです。
1) 不快な書き込み。
これを管理ノードが削除してしまった場合に「俺にとっては必要な情報だ」ともんくが出るかもしれません。
これには2ちゃんねるブラウザのローカルあぼーんのように、実際には削除せずにただ見えなくするという方法がとれます。しかし、
2) 法に反する書き込み。
この場合、キャッシュからすみやかに削除することが求められるでしょう。
実際に削除する機能も必要です。
しかし、これでは何を削除するかは管理ノードの管理者にゆだねられてしまいます。
よろしくないですね。管理ノード管理者がいわゆるスレ主になってしまいます。
レンタル掲示板や個人的な掲示板ならばそれでもかまわないのですが。

新月で完全に同期しきれていないのがくやしくて、DHT を考えてみたけどダメでした、ということで。
掲示板である以上、(一部の)レスが読めないことによる会話の齟齬は無くしたいのですけど、
いい方法はないものですかね。
38f82a55 anonymous 2005-06-20 08:36
>>1dd5e073
Jcode.pmは?
de1c423d むつ 2005-06-20 08:46
>>38f82a55
>>ffef6d78
ああ、インプットファイルの文字コードを指定してやれば、化けないかもしれませんね。
http://openlab.jp/Jcode/Jcode.html を見るかぎりは無さそうですが。
e3fad277 むつ 2005-06-20 08:56
>>de1c423d
$str = Jcode->new($str, utf-8)->sjis;
とかすればいいみたい。書いてあるじゃん。orz
83ac2b19 むつ 2005-06-20 08:56
>>e3fad277
s/utf-8/utf8/ どうした、自分。ねむいのか。
21b45a68 むつ 2005-06-20 13:29
>>83ac2b19
Encode.pm でも出来ました。こっちにしようかな、最初から入っているし(5.8 系)。

朔 0.4.1 ではレコード消えてないみたいだけど、バグによるものかな?
ま、0.4.2 出ているからどうでもいいけど。
shingetsu/config.py の save_recode = 10*366*24*60*60 にしてから、
バックアップキャッシュをもどし、それから今のキャッシュをもどせば復旧できる?

他の人はこのレコード削除仕様でかまわないのだろーか。
日記を備忘録代わりに使っている身としてはつらい。
つか、スレッドの上のレスからじわじわ消えていくのは奇妙。なれの問題か?
dat 倉庫作って、最初の書き込みから1年が経過したら dat 落ち、10MB 越えたら dat 落ちのほうがよさそうな……?
個人的には dat 落ちしても更新は続けてもらわないとこまるけど。
(消さないことを基本としているうちのノードと他のノードではスレッドごとのばらつきが大きかったり)。
ああ、同名のスレッドが作られたらコンフリクトするか……。
7ecb9b04 むつ 2005-06-20 16:03
いろいろ考えましたが、結局は過去ログ生成スクリプトを作ることにしました。
2ちゃんねるブラウザゲートウェイ(2chBgw ... かっこよくないな)のレス 1000 件突破問題の対処にもなりますので。
list_* のほうも、100 件超たら、それはそれは見づらい、というか、別のカテゴライズがなされることでしょう。
ノートは、、、残しておきたいのは更新するかな。

ま、なにかやるのは来週になると思いますが。今週はやることがあるので。
(やることというのは基本的にやりたくないことで、やりたくないから逃げるかも)。
74eca8c8 むつ 2005-06-22 13:23
やっぱりレコードが消えるのはおかしい、と感じていました。
なんでそう感じるかを昼メシの片づけをしながら考えてみました。

スレが唐突に始まるから。
私はスレの一番最初にそのスレッドの説明、立てられた意図が書いてあることを期待しているようです。
2ch は大抵書いてありますね。書いていないものはレスが続かず、消えていきます。
スレ違いでもそのまま伸びていくこともありますけどね。

スレッドを新規作成するときは、必ず本文が必要。
そのレコードは特殊で、他にレコードが存在する場合は消えない。
(他にレコードが存在しない場合は一般のレコードと同じように消えていく)。
とかどうでしょうか? もっとも、特別扱いは(プログラム的に)綺麗じゃないかもしれませんが。

まあ仕様変更はさておき、皆が皆デフォルトの設定で使かっていた場合、どうなるか、どうすれば回避できるか考えてみたいと思います。
ここでは、スレの一番最初の書き込みを(適当ではないのですが)テンプレと呼びたいと思います。

ケース1:毎日更新アクティブなスレッド
これはそのままでも問題なさそうです。必要なのは最近の書き込みであり、
テンプレはあまり必要なさそうです。
[[雑談スレッドだよもん]] のようにあったほうがよいものもあるでしょうが、
これは誰かがコピペするんじゃないでしょうか。
その際、[テンプレ] 等、検索できるようにし、かつ、それを周知させる必要がありそうですが。

ケース2:週イチ(月イチ)更新過疎なスレッド。トータル書き込み数多。
テンプレがないと何の話しだか分らなくなりそうです。
その時点でアクティブではないので、テンプレがコピペされる可能性は低いでしょう。
回避策は思いつきません。

ケース3:週イチ(月イチ)更新過疎なスレッド。トータル書き込み数少。
ケース2と同様。書き込みが少ないということはどうでもいいスレだった可能性が高く、
そのまま消えるにまかせれば良い気がします。

なんだ、あんまり困りませんね。
心配なのは、書き込み少ない→過疎と判断→新規参入者減→書き込み減→以降ループ が加速しやしないかということですが。
そもそも新規に書き込む人が少ない(いない?)現状では杞憂です。

あとはせっかくの書き込み、消すなんてもったいないという貧乏性な感情くらいですが、
これは個人的なものですので、shingetsu/config.py をちゃっちゃと書き変えるということで。
0b274ed2 anonymous 2005-06-22 18:10
>>74eca8c8
> 私はスレの一番最初にそのスレッドの説明、
> 立てられた意図が書いてあることを期待しているようです。
> ...
> スレッドを新規作成するときは、必ず本文(テンプレ)が必要。
> そのレコードは特殊で、他にレコードが存在する場合は消えない。

これは新月プロトコル0.2が出来たときにさんざん議論されたんですよ。
僕はIRCのように、古い書き込みを残さないのがよいと主張しました。
また新月の原理上、「テンプレ」は失なわれる可能性があるから、
説明や意図はスレッド名に含ませるべきだと。

新月プロトコル0.1やCrescentプロトコルでは(原理的には)
「雑談スレッドだよもん」というタイトルを持ち、
「語尾にだよもんをつけるべし」というテンプレを持つ、
fee30740d6ab33daa452a922da5041bbという識別子のスレッド、となります。
データの中身が消えてしますと、fee30740d6ab33daa452a922da5041bbという
謎の文字列が残るだけです。

新月プロトコル0.2以降では
「雑談スレッドだよもん」というタイトルを持ったスレッド、となります。
タイトルがそのまま識別子になります。
データが消えてしまっても、「雑談スレッドだよもん」を再開することができます。

つまり、

僕は積極的に古い書き込みを削除したい
  ↓
書き込みを削除しても残るのは識別子(ファイル名)だけ
  ↓
ファイル名をタイトルそのものにしてしまおう

こんな感じですね。
a670ada3 むつ 2005-06-22 19:17
>>0b274ed2
>これは新月プロトコル0.2が出来たときにさんざん議論されたんですよ。
そうでしたか。失礼しました。一応昔から見てはいたのですが、スルーしていたようです(空白期間があるものでして)。
結局は
積極的に古い書き込みを削除したい

積極的に古い書き込みを公開したい/公開してもらいたい(私)

どっちでもいい(おそらく大多数)
ということなのでしょうね。

#Internet Archive はこういう私にはピッタリのサービスです。
#「消したはずの〜」と嫌う人もいますが。
16f53ffe anonymous 2005-06-22 21:33
>>a670ada3
過去ログはHTML等に変換して(2chのDATみたいなのでもいいけど)
静的に公開すればいいんじゃないですかね。
新月の利用規定では、書き込みは転載されても構わないことに同意する建前になってるし。
0db4326a むつ 2005-06-26 18:49
私事でほげふがしていましたむつです。
んで、その私事で今日筑波大学のなかを通ったんです。本当にただ通っただけなんですが。
(無断侵入……?)
なーんか、DHT のなにごとかがあったような記憶が頭の片隅に引っかかっておりました。

[DHT]DHTオフ会参加者募集について

DHTオフ会開催概要:
□日時:6/26(日)13:30~
(開始時間は参加人数により前後します。)
□開催場所:筑波大 (詳細な場所は後日参加者にお伝え致します。)

http://toremoro.tea-nifty.com/tomos_hotline/2005/05/dhtdht_57f1.html

あーやっぱり。今日でした。
外から覗いてみてもよかったかなー。ま、あそこは広すぎるんで、場所探すのなんか無理なんですけど。

と、筑波大学近辺(でもないけど)に住んでいることをにおわせてみました。
mixi や blog で感想、レポートを書いている/書いた人がいそうですので、探してみます。
e2c4a059 むつ 2005-07-01 23:42
dijjer.org が動きません。だれかたすけてください。

[INFO] Connecting to the network
[INFO] Attempting to assimilate through choco.homelinux.org:9114
[INFO] 19379 9114 -> choco.homelinux.org:9114 : joinRequest {joiner=localhost:0, ttl=10, exclude=[], uid=-576804050}
[ERROR] [07-01-2005 21:52:49] dijjer.io.comm.RoutingTable.joinSeed(line:-1) Seed peer choco.homelinux.org:9114 failed to respond to join request after 30 seconds
[WARNING] [07-01-2005 21:52:49] dijjer.Dijjer$1.run(line:-1) Failed to seed using choco.homelinux.org:9114

(中略)

[FATAL] [07-01-2005 21:54:19] dijjer.Dijjer$1.run(line:-1) Failed to contact any of my seednodes and no peers in RT

ping してみたところ、choco.homelinux.org (他、seednode)は生きているようです。
うち、ルータ使ってますが、DMZ で全部メインマシンに飛ばしてます(マテ
java 1.4.2_08 でも、java 1.5.0_03 でもダメ、Windows XP 上の java 1.5.0_03 、Dijjer.exe もダメ。
ルータ挟まずに直結してもダメでした(for Win)。
1d91dac8 むつ 2005-07-04 20:29
[[P2Pバトン/9e4a31ca]]
Peercast のバージョン間違えた。正しくは 0.11/0.12 。
使ってないからこういうミスをするんだ。ひさしぶりに使うかなー。
f688d7d7 むつ 2005-07-06 20:10
なんとなく i2p で匿名サーバを公開してみました。
はたして外部から見れるのか不明です。おひまな方いらっしゃいましたら、テストしてみてください。

./i2prouter start
http://localhost:7657/
左メニューの Peers より reseed(?)(refeed だったかも)クリック。

http://mutumin.i2p/fswikil/?i2paddresshelper=ENCsv7W8dHvL~vn6GT57gMCYhXtBCvSnQAOGVuQKKD5s2ZglNCoHzxHgPV20w5-UhqXJ1WNPGW0cSnU-Gn89T3wTCg9YWcIabfS6KoPBy29huA-YSyK0r2rnqihsDSkHHrI2dw5QXZ6eTNdNbMq00sbN4G2ycYrOBQOIKKO1AkZv-2skZ0yPSxDnKsz5fYmn5m5u7jZXcfbPTUs1l81AAjr~6remnFlJa6OuhBRXEJAOWJbLsIZqsZyCj2ajFR39iDKqS007yJl1rGdRazI5RHlDMwidG7QrHcxcZIhsU3TjmkuvJptGLscqT90zLtACxV~REov3beNAPV9N3D~22GgpTxhb4vYsO~RZHEs7mfJOET4LvERq8UHkJSeH9r8GIiF952klGr1UpIWwJ-VlHRG2ns8ADxUDkVwfayH4fF9xZIN7cNKvNwCyoeSsvYWU77BbQkz-kB2DlbUmPk39l5XfCAb~H4Fl7vm0k59VMDFt5tPuquLxkg5ocPsJwThPAAAA

一度繋がれば、以降は http://mutumin.i2p/fswikil/ でアクセスできます。
テストなのでそのうち消えますけど。

i2p: http://www.i2p.net/
f73847cc むつ 2005-07-06 20:12
>>f688d7d7
http://*.i2p には http proxy: localhost:4444 を設定してから移動してください。
Tor の hidden service と同じですね。
fd522a3d むつ 2005-07-07 00:52
十六夜を試してみました。
先ずは Tomcat5 で。nutch の為に入れてましたので。
index は表示されました。list は……。
java.lang.RuntimeException: org.apache.velocity.exception.ResourceNotFoundException: Unable to find resource 'list.txt'
list.txt って何でしょう? 分らないのでスルー。
続いて jetty-5.1.4 で。うん、何の問題もなく使えました。
細かな設定が出来てイイです。昇順降順、何件表示。いいかんじです。

[[d55d278eのチラシの裏]]
[jetty | http://www.mortbay.com/jetty/]

Top of this page. | <<last <<new 0 1 2 3 4 5 6 7 8 9 10 old>>

limit: 1536KB

(むつの日記/532/3.8MB)

Powered by shinGETsu.