最終更新: 2014-12-05T17:23+0900
送信元が限られてるのかワンパターンだったので、これまでは </a> を NGワードにしてほとんどの spamを防いでいたんだけど、今日は手ひどくやられた。
フィルタはインストール方法がよくわからない。Comment-key Filterを tdiary/filter/ に設置したがエラーが出るので、とりあえず最新の 2.3.3.20091124にアップデートした。そうすると plugin/60sf.rbが有効になっているはずなので misc/filter/ にフィルタスクリプトを、misc/filter/plugin/ にフィルタに関連する設定などを表示するプラグインスクリプトを、misc/filter/plugin/ja/ などにプラグインの言語リソースをインストールし、設定画面でフィルタを有効にするといずれのスクリプトも読み込まれるようになる。
コメントフォームにキー文字列を埋め込み、コメントが HTMLフォームを通して投稿されたことを確認する。キーは日記設置者の決めた文字列と日記の日付によって一意に決められるので、ある日のキー文字列を一度取得すればその日には何件でも機械的に投稿することができる。GETして HTMLを切り刻む手間をかければ最初から機械的に投稿することもできる。そんなのは防げない。
tDiary-2.3.3.20091124にインストールするのなら key.rbを misc/filter/key.rbへ、comment_key.rbを misc/filter/plugin/key.rbへ、ja/comment_key.rbを misc/filter/plugin/ja/key.rbへコピーすれば良い。key.rbというファイル名と KeyFilterというクラス名は対応しているので、key.rbから comment_key.rbへの改名はやめたほうがいい。コピー後にフィルタを有効にし、キー文字列を設定する。
連投対策。同じ IPアドレスからの連続する投稿をはじく。30分につき 3件までしか許可しない、など。
# coding: utf-8 # # limit_freq.rb: # # a spam-filtering plugin of tDiary # rejects frequent comments posted from an IP address. module TDiary::Filter class LimitFreqFilter < Filter def comment_filter( diary, comment ) now = Time.now.to_i comment_i = Comment_t.new( now, @cgi.remote_addr ) # 数値形式の日時と文字列形式の IPアドレスの二要素 # 配列の配列を、日時をもとに昇順にソートしたもの。 # log = [[123456, "1.2.3.4"], [234567, "5.6.7.8"],...] log = [] require 'pstore' ps = PStore.new( cache_path ) ps.transaction( false ) { |db| log = db.fetch( DBRoot, log ) # 新しいコメントを logに追加する。 log.insert( ArrayExtension.lower_bound(log){|pair| pair.first - comment_i.time }, [comment_i.time, comment_i.ipaddr] ) # 古い logを捨てる。 oldest = now - time_span log.slice!( 0 ... ArrayExtension.lower_bound(log){|pair| pair.first - oldest } ) db[DBRoot] = log db.commit } # 残った logに投稿者の IPアドレスがいくつ含まれるか数え、 # その数が閾値を超えていないか確かめる。 count = 0 if log.all?{|pair| count += 1 if pair.last == comment_i.ipaddr count < threshold } then return this_is_not_a_spam( comment ) else debug("limit_freq.rb: spam: the # of comments posted from #{comment_i.ipaddr} exceeds threshold:#{threshold} within the last #{time_span.to_i}seconds.") return this_is_a_spam( comment ) end rescue debug("limit_freq.rb: BUG: #{$!}") return this_is_not_a_spam( comment ) end private DBRoot = 'LimitFreqLog' Comment_t = Struct.new(:time, :ipaddr) def cache_path return File.join( (@conf.cache_path || "#{@conf.data_path}cache"), 'limit_freq.data' ) end # どれだけの期間(秒単位)、コメントの投稿頻度の判定に # 利用するログ(日時とIPアドレスのペア)を保存するか。 def time_span 30 * 60 end # time_span当たり、何件目の投稿からを拒否するか。 def threshold 4 end module ArrayExtension # ソート済みだという前提を活かしていない! def lower_bound( arr, &block ) index = 0 arr.length.times{ return index if 0 <= yield( arr[index] ) index += 1 } return index end module_function :lower_bound end end end
やめればいいのに本体もちょろちょろと変更。
Index: core/tdiary.rb =================================================================== --- core/tdiary.rb (リビジョン 44436) +++ core/tdiary.rb (作業コピー) @@ -342,6 +342,22 @@ @logger.info("#{@cgi.remote_addr}->#{(@cgi.params['date'][0] || 'no date').dump}: #{msg}") end + + private + # config: hide or drop spam comment + def hide_spam? + return @conf.options.include?('spamfilter.filter_mode') && @conf.options['spamfilter.filter_mode'] + end + + def this_is_a_spam( comment ) + comment.show = false + return hide_spam? + rescue + return false # comment could be a String(@cgi.referer). + end + def this_is_not_a_spam( comment ) + return true + end end end @@ -1303,7 +1319,7 @@ filter_path = @conf.filter_path || "#{PATH}/tdiary/filter" Dir::glob( "#{filter_path}/*.rb" ).sort.each do |file| require file.untaint - @filters << TDiary::Filter::const_get( "#{File::basename( file, '.rb' ).capitalize}Filter" )::new( @cgi, @conf, @logger ) + @filters << TDiary::Filter::const_get( "#{File::basename( file, '.rb' ).split(/[-_]+/).map{|x|x.capitalize}.join('')}Filter" )::new( @cgi, @conf, @logger ) end end Index: core/plugin/60sf.rb =================================================================== --- core/plugin/60sf.rb (リビジョン 44436) +++ core/plugin/60sf.rb (作業コピー) @@ -4,10 +4,9 @@ # Modified by KURODA Hiraku. SF_PREFIX = 'sf' -@sf_path = ( @conf["#{SF_PREFIX}.path"] || "#{::TDiary::PATH}/misc/filter" ).to_a -@sf_path = @sf_path.collect do |path| - /\/$/ =~ path ? path.chop : path -end +@sf_path = ( @conf["#{SF_PREFIX}.path"] || "#{::TDiary::PATH}/misc/filter" ).to_a.map{|path| + path.chomp('/') +} # get plugin option def sf_option( key ) @@ -128,7 +127,7 @@ if File.readable?( path ) then begin require path - @sf_filters << TDiary::Filter::const_get("#{File::basename(filename, ".rb").capitalize}Filter")::new(@cgi, @conf, @logger) + @sf_filters << ::TDiary::Filter::const_get("#{File::basename(filename, ".rb").split(/[-_]+/).map{|x|x.capitalize}.join('')}Filter")::new(@cgi, @conf, @logger) plugin_path = "#{dir}/plugin/#{filename}" load_plugin(plugin_path) if File.readable?(plugin_path) rescue Exception
一件二件すり抜けるぐらいはいいかと思っていたがここ数日は毎日なのでいいかげん腹が立つ。なによりアクセスログを見たらヒット数、転送量トップが spammerだというのが決定的に許せない。節度を知れ。iptablesはいじれないので .htaccessで Apacheに拒否してもらう。
spamコメントがくる月っていうのは、いつもの決まった 2、3か国からのアクセスではなく 10近い国から少数ずつアクセスがあるもんだけど、日単位では固定の IPアドレスから数十件の spamがくるのが常だった。でも今日は一件一件みごとに IPアドレスが異なっている。IPアドレスブロックで次のステージに進んでしまったのか。
spamコメントの目的が特定の URLへの誘導であるかぎりは、コメントに含まれる URLのドメインが白か黒かを判定する方法が有効でしょうね。外部に問い合わせるのは避けたかったんだけど、spamコメントの内容が URLも含めてワンパターンだから実際の問い合わせはごくごく限られた回数にできそうだし、悪くないかな。
ここで上記の comment-keyフィルタも含めてスパムフィルタの最新版が管理されていた。 >http://coderepos.org/share/browser/platform/tdiary/filter
plugin/00default.rbに含まれるメソッド navi_itemを自分でも使っていたのだけど、tDiaryをアップデートしたら三番目の引数が真偽値からリンクの rel属性文字列へと変更されているせいで rel="true" なるリンクができていた。こうする。
def navi_item( link, label, rel = nil ) rel = "nofollow" if rel == true # backward compatibility
スパムコメント一掃のために YYYYMM.tdcを削除したけど日記の編集画面からコメントが消えない。YYYYMM.parserを開くとコメントが含まれていたし、これを削除すると編集画面からもコメントが消えた。原因はデータファイルを直接削除するというイレギュラーな操作だけど、日記の編集はマスターデータに対して行いたい気もする。
最終更新: 2010-03-08T01:18+0900
やっぱり、全画面表示にしていてもエクスプローラーが隠れてしまわない、っていうのが一番便利な点だと思います。
基本的にファイルをいろいろ開きまくるタチですから、タブとエクスプローラー的なものは結構重要だったりしますw
自分もエクスプローラビューの価値を理解しない、Windows Explorerにもナビゲーション ペインを表示させない人間なので、エディタにフォルダツリーにそういう価値(エクスプローラが隠れない)があるのを初めて知った。
それでも反論はある。
例えば、Vistaのフォルダ画面はフォーカス可能な場所が多すぎる。
アドレス欄 > 検索欄 > 状況に応じて変化するツールバー > リストビュー > カラム > (アドレス欄に戻る)
肝心要のリストビューに確実にフォーカスを移動する最短手順は Ctrl+E、↓だと思っているが他にあるだろうか?そしてエクスプローラがまたよくフォーカスを見失うんだ。そのたびに Ctrl+E、↓。
キーボードでアクセスできない機能があってはいけないと思うし、状況に応じて変化するツールバーはタブレットで操作しやすいらしいから、フォーカスできなくしたり、ツールバーを消したりするのはいい解決ではない。リストビューにフォーカスするショートカットがあればいいのかなあ。とすると編集領域にフォーカスするショートカットがあるならエクスプローラビューがあっても困らないな。
脱線。カラムクリックでソートする機能はエクスプローラが気軽にフィルタ、ソートできるツールなら役に立つんだろうけど、なにせ表示設定に関して馬鹿だからなにも変更したくない。ソートするときは間違ってカラムをクリックしたときだけだから、とにかく邪魔。Thunderbirdもメールのリストをカラムクリックでソートできるけど、メニューでソート条件を(より細かく)変えられるからカラムクリックはできないほうが使いやすい。そもそも最初に設定したとき以外にソート条件を変更したのって間違えてカラムをクリックしたのを戻すためだ。カラムのすぐ上にタブバーや QuickFolderのブックマークが存在するので今はこれらの操作に余計な気を使わされている。
最終更新: 2010-03-08T20:41+0900
長ったらしい事前共有キーをこねくりだす必要もなかった。
「親機のボタンを押すことでも設定できます(という意味のメッセージ)」が気が利いている。初めて無線LANを導入する人にとっては存在しないパスワードを聞かれているのに等しい状況だろうからこれは助かる。
それでも問題はあるわけで。
既存の設定済みの Buffaloの無線ルーターの下に新しい無線ルーター(これも Buffalo)を接続したので、どちらも同じ 192.168.11.1(デフォルト設定)を名乗ってしまったことが原因っぽい。無線の問題では不具合が突然起こりよくわからないうちに直ってしまうことがよくあるのではっきりしないけど、時系列順に並べると、1.DHCPサーバーが見つからないと二台目のルーターが報告。2.二台目の LAN側IPアドレスを 192.168.12.1にした。3.開通。
現実には 1と 2の間には「あれ、おかしいな」という疑問のぐるぐるする時間があり、2の行動に根拠はなく、問題が起こったことで問題がありそうだと思っていた部分(重複するだろう IPアドレス)をいじってみただけだし、2と 3の間にも DHCPサーバーが見つからないという 1と同じエラーや、ちょっと違うエラーが出ていたりする。
タスクマネージャの「ネットワーク」タブ、「リンク速度」カラムで確認してるんだけど、理論値 300Mbpsを謳う親機と子機のセット製品なんだから 54Mbpsは間違ってる。
子機のセキュリティ設定を、自動設定された WPA2-PSK(TKIP)から WPA2-PSK(AES)に変更した後で確認したら 270Mbpsになっていた。(親機と子機を本来の設置位置に移動すると 84Mbpsくらいになっていたから 300Mbpsにならないのは普通らしい)
最終更新: 2010-02-26T20:42+0900
いやはや、数字を数えるのも難しいものですよ。 {}の次が{{}}で、その次が{{},{{}}}で、次に{{},{{}},{{}, {{}}}}くらいまでは、すぐに分かりますが、 数学が苦手な私には、その次の{{},{{}},{{},{{}}},{{},{{}}, {{},{{}}}}}はなかなか出てこないですねぇ。
こういう話をかみ砕いて順々に展開していっていたのが『[単行本] ドナルド・E. クヌース【至福の超現実数―純粋数学に魅せられた男と女の物語】 柏書房』だったっけ。
1、2週間前の大雨の日に乗って以来、シフトの調子が悪かった。重いし変わらないし。シフトワイヤー(in&out)を交換してもらったらワイヤーの先に何もつながってないんじゃないかという軽さ。忘れていたよ。調整後にさらにちょっと伸びたのか、チチチチチとシフトダウンに失敗する段があって手元でアウターをちょっと延長した。購入した店だと完璧にやってくれるんだけどね。
最終更新: 2010-02-26T19:22+0900
当たり前のことを書こう。1) const int* と int* const. ポインタが constなのは後者でポインタの指す対象が constなのが前者。2) const char* と char*はどちらもポインタ型だけど、int*と char*ぐらい違う型だと認識すべき。const_castや reinterpret_castが使えるという点で、関数ポインタやメンバ関数ポインタとその他のポインタを比べたときほど違いはしないようだが。ついでに、関数ポインタのサイズ以上の落とし穴を最近知った。「配列の要素の次のアドレス モナド」配列の最後の要素の次の次を指すポインタが配列の先頭を指すポインタより大きいとは限らないんだと。数値にもオーバーフローがあって数が巻き戻ったりするから、むしろ、配列として確保されたメモリ領域を一つはみだした部分を指すポインタが配列の要素を指すポインタより大きくなければならないと予め決められている部分に感心すべきか。
constで検索したら建設関係ばっかり。URLに constが含まれてるだけなのに。(ほとんど全ての) URLと同じ文字を使って文章を書いてる人らはこの検索結果に満足できる?日本語で検索する場合はマッチするのは本文に限られるし自動で言語フィルタまでかかってるようなもので全く問題ないけど。
Vistaで Media Player Classicが Windows Updateのあとエラー終了するようになるのも 2chで報告されていて、自分の所(Vista x64)でも mp3は再生できるけど動画が再生できなくなってる。これも直してほしいなあ。Media Player Classic Home Cinemaは終了しないみたいだけど、これは Quick Time系の動画みたいにシークが遅いのでできれば使いたくない。シーク速度を改善する方法はあるのかもしれないけどコーデックとかフィルタとかわからんのだよね。
Alt+Spaceでシステムメニューを開けない(Alt, Spaceでならできる)し、動画の再生中はスタートメニューの電源ボタン(スタンバイに設定)を押してもロックにしかならなくて、ファンが回りっぱなしで驚かされたりもするし(MPC HCがやってるというよりはメディア共有の省電力設定が影響してるのかもしれないけれど)。
水を差す。これまでにためたポイントを使ったから○○円得した。今回△△ポイント付いたから△△円得した。この二つの合計を割り引いて実質 160円で買えた。なんていうのはポイントの価値を二倍に水増しした誇張でしょ。次に何か買うときもポイントを使ったから△△円得した、っていいませんか?
恨みがあるわけじゃなくて、アマゾンの書籍に付くゴミみたいなポイントだとか、スーパーでレジ袋を断ったときの 2円引きがなくならないかなあと日頃思っていることを吐き出したかっただけ。
レジ袋に関して。断って 2円引いてもらった後でやっぱり手持ちの袋に入りきらないことがわかった場合に袋をもらうことはできるのかとレジの青年に聞いてみたら、考えたこともないと。彼なら 2円引いてもらった上で快く袋をもらえそうだ。
最終更新: 2010-02-12T00:42+0900
一級と特級はやってみるまでもなく無理だ。5分で手のひらの筋肉がつりそうになった。漢字変換がないだけでこうも疲れ具合が違うとは。