Mozilla 翻訳 フォーラム一覧 Mozilla 翻訳
Mozilla Japan 翻訳部門では mozilla.org 全体の日本語化を目指して活動していました。
このサイトは 2022 年 1 月に終了しました。
Mozilla Japan コミュニティポータル から関連サイトをご利用ください。
 
 よくある質問よくある質問   検索検索   登録ユーザ一覧登録ユーザ一覧   グループグループ   登録登録 
 ユーザ設定ユーザ設定   ログインして PM を確認ログインして PM を確認   ログインログイン 

Analog を使って新しい未訳ドキュメント一覧を作りましょう

 
このフォーラムはロックされているため、新規投稿、返信、編集を行うことはできません   このトピックはロックされているため、返信、編集を行うことはできません    Mozilla 翻訳 フォーラム一覧 -> 翻訳部門の活動
前のトピックを表示 :: 次のトピックを表示  
著者 メッセージ
pswf



登録日: 2003年7月 16日
記事: 543


ユーザ情報を表示 メッセージを送信
記事 件名: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月06日(火) 18:06 引用

日曜日の blog に書いたのですが、mozilla.org 日本語版のページ数もようやく本家の 1 割に達したようで、
今やほとんどの主要ページは日本語で読むことができます。
http://pswf.s33.xrea.com/archives/2004/01/#a20040104

まだわずか 1 割ですが、個人的には、次にどこを訳せばいいのだろう、というのが正直なところ。
リクエストもなかなか出ない中、残り 9 割の未訳ドキュメントをむやみに和訳していくというのは効率的ではないと思います。
そこで、Analog というアクセスログ解析 CGI を導入して、「404 翻訳者募集中」が多く出ている未訳ページを特定して、
そのリストを和訳の優先順位にしていったらどうかと思いました。

実際に Analog が出した mozilla.org 日本語版のアクセスログ統計があるので見てください。
これは 2001 年に試験的に実施したものらしいので、内容自体は古いですが、どんなものかは分かると思います。
http://www.mozilla.gr.jp/test/analog2.html

この中に「失敗したリクエストレポート」という項目があります。これが、「404 翻訳者募集中」となっている
未訳ページのリストです。アクセスされた回数の多い順、つまり需要の高い順に並んでいます。
このリストをそのまま和訳の優先順位にあてはめて使えないだろうか、と考えたわけです。

和訳プロジェクトのサイトには未訳ドキュメントの一覧がありますが、相当古くなっていますし、
今から作り直すにしても、機械的に生成しているので、すべての未訳ページがリストアップされてしまいます。
中には時代遅れになってしまったドキュメントもあり、片っ端から訳すわけにもいきません。

もちろん、自分で担当するディレクトリを決めて順番に和訳していく方法も、それはそれで良いと思いますが、
私のように担当ディレクトリを決めていなかったり、新たにプロジェクトに参加したいと思う人にとっては、
これから和訳すべきドキュメントの優先順位がハッキリしていれば、とても参考になると思います。

問題は、Analog は CGI なので、ログが長いと解析に時間が掛かり、それだけサーバにも負荷が掛かるということです。
実際に使えるのかどうかは、root 様に要相談ということになります。

ちなみに、もじら組のアカウントを持っていれば、解析していない「生」のエラーログを見ることができます。
試しに、直近のエラーログから必要ない部分を削除したものを用意してみました。
ただしこれだと、まさに生ログなので、一目でアクセスの多い順番は分かりません。
http://www.mozilla.gr.jp/~pswf/jt-404.txt

それと、注意したいのは、Analog の場合も、生ログの場合も、404 を出したドキュメントが、実際に本家に
存在するのかどうかは分かりません。いわゆる「ダウンロード支援ソフト」などで、存在しない間違ったファイルに
連続してアクセスしてくる場合も時々あります。上の生ログの 2 行目はその典型的な例です。
まあ、Analog でアクセスが多い順に並べてしまえば、この問題はかなり解消されるはずです。

プロジェクトの作業効率化の一環として、Analog は、使えるならぜひ使ってみたいツールだと思います。
検討してみませんか?
dynamis



登録日: 2003年5月 22日
記事: 442


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月07日(水) 07:42 引用

pswf さん、あけましておめでとうございます。
いつも JTP をリードして作業していって下さっているのは流石ですね。;-)

pswf wrote:
問題は、Analog は CGI なので、ログが長いと解析に時間が掛かり、それだけサーバにも負荷が掛かるということです。
実際に使えるのかどうかは、root 様に要相談ということになります。


Analog を動かす処理の負荷については何とかなるかと思います。
現在スタッフMLでインプレスさんにサーバをご提供頂くお話では、 CPU は Celelon 2GHz などということですから、サーバ移行後は問題ないのではないかと。
インプレスさんのお陰でこんな事もできるようになったとお伝えできますし。;-)
…この話、ML外では秘密ってことはないですよね?もしそうだったらゴメンナサイ。(^^;

ただ、今回の目的からすれば Analog は不要と考えます。理由は3つ。

・現在アクセスログが分割保存されていないので扱いにくいこと
まぁ、これについては設定次第でどうとでもなりますから問題ないですか。

・Analog 管理の手間
問題なく使えるように練習と管理をしていく手間があります。一度用意してしまえばそれで済むと言えばそうなんですが、現在 JTP 内部のスタッフでは Analog を管理できる人がいないような気がします。小沢さんとかは経験あるのかな?
# 私も Analog の使用を検討していますが、ToDoList の後ろの方に回っています。(^^;

この二つは半分冗談ですが、次は真面目な理由です。
・もっと手軽に処理できる
アクセスランキングを作りたいのでしたら 1liner で処理できます。
例えばこんな感じでしょうか(アクセスログの書式は標準のものと仮定)。
Code:
tail -n <lines> <logfile> | cut -d \  -f 2 | sort | uniq -c | sort -r > ranking

出力例はこれ。
http://moz.skillup.jp/temp/ranking
# lines = 100000 として最新の100000アクセスについて処理してみました
# 所用処理時間は十数秒程度でした。
# 最新といっても 10/Oct/2003:10:41:58~11/Oct/2003:20:47:02 です。
# ログファイルがファイルサイズ制限の2GBに達して追記不能になっている模様。(T T)

画像が多いのが邪魔なら途中で grep も通すようにすればOK。例えば・・・
Code:
tail -n <lines> <logfile> | cut -d \  -f 2 | sort | uniq -c | grep -v '\.\(\gif\|png\|css\|js\)$' | sort -r > ranking

http://moz.skillup.jp/temp/ranking_html

GET 以外のメソッドを除いてカウントしたい場合や特定回数未満のアクセスは除外する場合なども grep を使えばOK。
foo, foo/, foo/index.html を区別してしまっているという問題についても sed で対処できますが、処理時間が一気に長くなりそう…

この程度のスクリプトを cron で定期実行するだけで必要十分かと思います。如何でしょう?

こんな感じで宜しければスクリプトファイルを用意してその定期実行処理を cron に追加してもらうよう おこめさん(root様)にお願いしようと思います。
# ログファイル設定変更などについても併せて…
pswf



登録日: 2003年7月 16日
記事: 543


ユーザ情報を表示 メッセージを送信
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月07日(水) 11:37 引用

dynamis wrote:
pswf さん、あけましておめでとうございます。

む、まだ新年のご挨拶をしてなかったですね(^^; 明けましておめでとうございます。今年もどうぞよろしく。

たまたま自分のサイトで Analog がデフォルトでインストールされていて、簡単に見られるようになっているので、
安易に提案してしまいましたが、実際に自分たちで管理するとなると、設定ファイルとか、いろいろ必要なことが出てきますよね。
導入に掛かる手間をあまり深く考えていませんでした...

dynamis wrote:
アクセスランキングを作りたいのでしたら 1liner で処理できます。

最初に投稿してから、そういえば PHP でスクリプトを書けないだろうかと思ってましたが、その手がありましたか Very Happy
正直に白状しますと、私は Unix をほとんど知らないのです(ぉぃ

で、早速 dynamis さんのコードを参考にして、オンラインマニュアルを斜め読みしつつ、とりあえず作ってみました。
(飲み込みの早い奴)

[mozilla.org 日本語版 エラーログ トップ 200]
http://www.mozilla.gr.jp/~pswf/jt_error_log

とんでもなく簡単で口あんぐり Shocked これだけなら Analog なんか使う必要まったくないじゃないですか(ぇ

favicon.ico と robots.txt は削っても良かったのですが、処理に時間が掛かるし見れば分かるので無視。
Not Found ばかりと思いきや、Forbidden もいくつか出てますね。

# Mozilla をはじめとする Gecko ブラウザは、初回アクセス時に必ず favicon.ico を参照します。
# このため、favicon.ico がないと、このように大量の Not Found が記録されてしまう。
# しかしなぜか、IE は favicon.ico がない場合、最初から参照しません。404 が残らない。IE ってスゴいね。
# つまりこの大量の 404 は Gecko ブラウザ家族の功罪です。だめじゃん。

解析結果を見て分かったこと:
リンク切れ、ファイル未登録など、未訳ドキュメント一覧というより、ホントにエラーログになってます。
/start/1.5/stylesheets.js - 私の担当ディレクトリですが、なぜか登録されてない。手元にはあるのに。
/firebird/ - 確かこれ、本家では /products/firebird/ へのリダイレクトになっているはず。/mozilla1.x/ なども同様。
... うーん。1 行ずつ問題を潰していかないと、ダメだこりゃ。

dynamis wrote:
この程度のスクリプトを cron で定期実行するだけで必要十分かと思います。

このリストは、そう頻繁に作成する必要もないと思います。
とりあえず問題点が把握できたので、それらを修正しつつ、1 か月に 1 度でも手動で実行してやれば良いんじゃないでしょうか。
それにしても、こんなに簡単にできるとは思いませんでした。
小沢



登録日: 2003年5月 23日
記事: 400
所在地: 愛知県


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月07日(水) 17:48 引用

pswf wrote:

[mozilla.org 日本語版 エラーログ トップ 200]
http://www.mozilla.gr.jp/~pswf/jt_error_log

上を見て調べてみると・・・。
http://www.google.co.jp/search?num=100&hl=ja&lr=&ie=UTF-8&oe=UTF-8&sa=G&q=%22jt.mozilla.gr.jp/roadmap.htm%22
なるほど、これは便利かも。。。
リンク修正お願いしないと?
____________________
いつも怒られっぱなしで負け組です。
pswf



登録日: 2003年7月 16日
記事: 543


ユーザ情報を表示 メッセージを送信
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月07日(水) 18:47 引用

とりあえず、それらしいものができました Surprised
http://www.mozilla.gr.jp/~pswf/jt_error_log.html

上のシンプルなリストに手を加えて、未訳ドキュメントが分かりやすいようにしてみました。
確認しながら、置き忘れているスタイルシートや画像も追加して、今後 404 にならないようにしました。

roadmap.htm のリンクミスは、数の多さからして、おそらくサイト内のものかと。
「ロードマップ」をググって、片っ端からチェックしていくしかないかも?
/docs/end-user/guide/ も、どうしたものか。
dynamis



登録日: 2003年5月 22日
記事: 442


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月12日(月) 14:26 引用

スミマセン、またしばらく雲隠れしてました。
帰っても力尽きて寝るだけとかいう日を減らしたい…(>_<)

pswf wrote:
で、早速 dynamis さんのコードを参考にして、オンラインマニュアルを斜め読みしつつ、とりあえず作ってみました。
(飲み込みの早い奴)

[mozilla.org 日本語版 エラーログ トップ 200]
http://www.mozilla.gr.jp/~pswf/jt_error_log

とんでもなく簡単で口あんぐり :shock: これだけなら Analog なんか使う必要まったくないじゃないですか(ぇ


流石 pswf さん、これなら安心して後はお任せ。(笑)

pswf wrote:
# Mozilla をはじめとする Gecko ブラウザは、初回アクセス時に必ず favicon.ico を参照します。
# このため、favicon.ico がないと、このように大量の Not Found が記録されてしまう。
# しかしなぜか、IE は favicon.ico がない場合、最初から参照しません。404 が残らない。IE ってスゴいね。
# つまりこの大量の 404 は Gecko ブラウザ家族の功罪です。だめじゃん。


うーんと、favicon.ico を参照すると言う事自体は駄目じゃないと思うのだけど、IE の動作とかよく分かんないしまぁ、墓穴を掘らないうちに黙ります(既に書いてる)。


pswf wrote:
このリストは、そう頻繁に作成する必要もないと思います。
とりあえず問題点が把握できたので、それらを修正しつつ、1 か月に 1 度でも手動で実行してやれば良いんじゃないでしょうか。
それにしても、こんなに簡単にできるとは思いませんでした。


そうですか、であればやはり pswf さんにお任せします。(爆)

簡単な事は簡単にできるというのが Unix の偉いところですからね。
まぁ、分からない事とか何かあれば遠慮無くどうぞ。
私も殆ど初心者みたいなものですが、分かる範囲でサポートします。;-)

404のリンク元について検索するのはGoogleにちゃんと専用の機能がありますので
http://www.google.co.jp/search?as_lq=http%3A%2F%2Fjt.mozilla.gr.jp%2Froadmap.htm
http://www.google.co.jp/search?as_lq=http%3A%2F%2Fjt.mozilla.gr.jp%2Froadmap.html
といったかんじですかね。;-)
pswf



登録日: 2003年7月 16日
記事: 543


ユーザ情報を表示 メッセージを送信
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月12日(月) 21:39 引用

Top 200 リストをアップデートしました。とりあえず解析完了。
http://www.mozilla.gr.jp/~pswf/jt_error_log.html

dynamis wrote:
404 のリンク元について検索するのは Google にちゃんと専用の機能がありますので
http://www.google.co.jp/search?as_lq=http%3A%2F%2Fjt.mozilla.gr.jp%2Froadmap.htm
http://www.google.co.jp/search?as_lq=http%3A%2F%2Fjt.mozilla.gr.jp%2Froadmap.html
といったかんじですかね。Wink


もちろん、404 のリンク元は片っ端から Google で調べました。
roadmap.htm の typo はおそらくサイト内だと思うんですけどね...
まだ Google には引っ掛かってないようです。気長に待つか。

404 な懸案事項は引き続き一つずつ解決していくとして、太字になっているドキュメントが、
このリストを作成した本来の目的である「未訳ドキュメント一覧」です。
Top 10 は以下のようになりました。意外な結果!? っていうか、最初から予測不可能だったわけですが。

http://jt.mozilla.gr.jp/projects/svg/build.html
http://jt.mozilla.gr.jp/docs/web-developer/bugspecs/REC-CSS1.html
http://jt.mozilla.gr.jp/newlayout/demo/
http://jt.mozilla.gr.jp/docs/dom/
http://jt.mozilla.gr.jp/projects/security/pki/jss/javadoc/
http://jt.mozilla.gr.jp/xpfe/xulref/
http://jt.mozilla.gr.jp/projects/security/components/ConfigPolicy.html - 登録できないとか何とか
http://jt.mozilla.gr.jp/docs/contribute.html
http://jt.mozilla.gr.jp/projects/security/pki/nss/ref/ssl/gtstd.html
http://jt.mozilla.gr.jp/roadmap/phoenix-advantages.html

このリストは、そのうちプロジェクトのサイトに載せましょう。
それとも、順番にリクエストを追加するか。
今日の作業はここまで...
tai



登録日: 2003年6月 07日
記事: 194
所在地: 横浜


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月12日(月) 22:43 引用

pswf wrote:
Top 200 リストをアップデートしました。とりあえず解析完了。
http://www.mozilla.gr.jp/~pswf/jt_error_log.html



うをー、すげー。こういうのをパパッと作っちゃうなんてすごいっす。
pswfさん、dynamis さん、小沢さん、ご苦労です。
しっかり利用させてもらいます。ありがとうございました Very Happy
dynamis



登録日: 2003年5月 22日
記事: 442


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月13日(火) 00:36 引用

pswf wrote:
もちろん、404 のリンク元は片っ端から Google で調べました。
roadmap.htm の typo はおそらくサイト内だと思うんですけどね...
まだ Google には引っ掛かってないようです。気長に待つか。


気長に待つくらいならエラーログにリファラを含めてもらいましょう。
例のアクセスログが溢れている件を報告し忘れていたのでそれと合わせてお願いしておきます。

pswf wrote:
http://jt.mozilla.gr.jp/projects/svg/build.html
http://jt.mozilla.gr.jp/docs/web-developer/bugspecs/REC-CSS1.html
http://jt.mozilla.gr.jp/newlayout/demo/
http://jt.mozilla.gr.jp/docs/dom/
http://jt.mozilla.gr.jp/projects/security/pki/jss/javadoc/
http://jt.mozilla.gr.jp/xpfe/xulref/
http://jt.mozilla.gr.jp/projects/security/components/ConfigPolicy.html - 登録できないとか何とか
http://jt.mozilla.gr.jp/docs/contribute.html
http://jt.mozilla.gr.jp/projects/security/pki/nss/ref/ssl/gtstd.html
http://jt.mozilla.gr.jp/roadmap/phoenix-advantages.html

このリストは、そのうちプロジェクトのサイトに載せましょう。
それとも、順番にリクエストを追加するか。
今日の作業はここまで...


うぐぅ。なんか私が草稿のまま止めているものがリスト上位に…(^^;
プロジェクトサイトに載せられる前に完成稿と偽ってみようか。(笑)
REC-CSS1.html も ToDoList には入っているのですが、いかんせん時間が…
小沢



登録日: 2003年5月 23日
記事: 400
所在地: 愛知県


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月13日(火) 09:50 引用

あ、あの・・・。

tai wrote:
pswf wrote:
Top 200 リストをアップデートしました。とりあえず解析完了。
http://www.mozilla.gr.jp/~pswf/jt_error_log.html



うをー、すげー。こういうのをパパッと作っちゃうなんてすごいっす。
pswfさん、dynamis さん、小沢さん、ご苦労です。
しっかり利用させてもらいます。ありがとうございました Very Happy

pswfさん、dynamis さんはともかう、私は何もしてません(涙
____________________
いつも怒られっぱなしで負け組です。
山口



登録日: 2003年5月 23日
記事: 2920


ユーザ情報を表示 メッセージを送信 メールを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月24日(土) 16:30 引用

pswf wrote:
Top 200 リストをアップデートしました。とりあえず解析完了。
http://www.mozilla.gr.jp/~pswf/jt_error_log.html

pswf さん、さらっと書いているけど、すごく大変な作業だったでしょう?

先ほど dynamis さんのコマンドを参考にして、ログを解析してみました(サーバでの処理に数分かかりました)。和訳プロジェクトの関係者から見るとやっぱりというか、心苦しいことに

Ongoing Localization Projects
http://www.mozilla.org/projects/l10n/mlp_status.html

が良く参照されていますね。他の一般的なファイルに比べて断トツです。本家にリンクするようにした方が良いのかな?

pswf wrote:
dynamis wrote:
404 のリンク元について検索するのは Google にちゃんと専用の機能がありますので
http://www.google.co.jp/search?as_lq=http%3A%2F%2Fjt.mozilla.gr.jp%2Froadmap.htm
http://www.google.co.jp/search?as_lq=http%3A%2F%2Fjt.mozilla.gr.jp%2Froadmap.html
といったかんじですかね。Wink


もちろん、404 のリンク元は片っ端から Google で調べました。

これ、先ほどリンク先を確認しましたが、引っかかっていますね。リンク先の HTML ソースを見てみたら、一カ所だけ roadmap.htm となっていました。

pswf wrote:
このリストは、そのうちプロジェクトのサイトに載せましょう。
それとも、順番にリクエストを追加するか。

順番にこだわらずにリクエストしても良いのではないでしょうか?

それが一番作業量が少なくて済みそう(楽することしか考えていない Wink )改めてリストを作成すると、今後更新作業というものをしなくてはならなくなるので、それは避けたいなぁ。現時点でも作業の量は一杯一杯だから・・・
dynamis



登録日: 2003年5月 22日
記事: 442


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年1月27日(火) 09:15 引用

山口 wrote:
pswf wrote:
もちろん、404 のリンク元は片っ端から Google で調べました。

これ、先ほどリンク先を確認しましたが、引っかかっていますね。リンク先の HTML ソースを見てみたら、一カ所だけ roadmap.htm となっていました。


サイト内リンクについては grep で探すとよいと思います。
取りあえず HTML ファイル中に roadmap.htm" あるいは roadmap.htm' といった文字列を含むファイルがないか grep してみましたが、存在しないようです。
Code:
grep roadmap\.html\ *\[\"\'\]  *.html
grep roadmap\.htm\ *\[\"\'\]  *.html
# コマンドラインで渡すためにエスケープがややこしいので注意。

などで検索してみたのですが、前者の正しいリンクは一杯見つかりますが、後者のリンクミスは見つかりませんでした。

山口 wrote:
pswf wrote:
このリストは、そのうちプロジェクトのサイトに載せましょう。
それとも、順番にリクエストを追加するか。

順番にこだわらずにリクエストしても良いのではないでしょうか?

それが一番作業量が少なくて済みそう(楽することしか考えていない :wink: )改めてリストを作成すると、今後更新作業というものをしなくてはならなくなるので、それは避けたいなぁ。現時点でも作業の量は一杯一杯だから・・・


まぁ、その辺は適当に、時々で良いんじゃないでしょうか。
外部から新たに協力してくれる人を呼びかける意味では、リクエストフォーラムというので既に十分に呼びかけができていると思いますので、実際に利用するのは既にこのフォーラムによく来ているメンバだけになるでしょうから…(^^;
西村



登録日: 2003年6月 08日
記事: 16
所在地: 武蔵国分寺


ユーザ情報を表示 メッセージを送信
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年2月24日(火) 03:30 引用

dynamis wrote:
pswf wrote:
もちろん、404 のリンク元は片っ端から Google で調べました。
roadmap.htm の typo はおそらくサイト内だと思うんですけどね...
まだ Google には引っ掛かってないようです。気長に待つか。


気長に待つくらいならエラーログにリファラを含めてもらいましょう。


error_log は書式が決まっているので、リファラを含めることはできません。
access_log から 404 の行だけ抜き出せばいいんではありませんか。

Analog や似たようなので Webalizerとか経験ありますが、設定自体はそんなに大変ではありませんが、
知りたい情報は結局取り出せないという感じがします。
結局 grep と組み合わせたり。
dynamis



登録日: 2003年5月 22日
記事: 442


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: Analog を使って新しい未訳ドキュメント一覧を作りましょう     投稿時間: 2004年2月24日(火) 04:48 引用

西村 wrote:
error_log は書式が決まっているので、リファラを含めることはできません。
access_log から 404 の行だけ抜き出せばいいんではありませんか。


ええ、ぼぉっとしていてうっかりエラーログ…と書いてしまっていました。
StaffML 3915 でアクセスログの書式変更のお願いとか書いたんですけど、返信が無くおこめさんに見逃されてしまった模様。(^^;

西村 wrote:
Analog や似たようなので Webalizerとか経験ありますが、設定自体はそんなに大変ではありませんが、
知りたい情報は結局取り出せないという感じがします。
結局 grep と組み合わせたり。


表示は綺麗になるんですけどね。
やりたいことが分かっていればシェルスクリプトでも書いた方が早かったりしますよね。
dynamis



登録日: 2003年5月 22日
記事: 442


ユーザ情報を表示 メッセージを送信 ウェブサイトに移動
記事 件名: Re: 脱線ちぅ     投稿時間: 2004年3月31日(水) 08:17 引用

Quote:
ログのローテート化は行われたのでしょうか?
Code:
CustomLog "|/usr/local/apache/bin/rotatelogs /usr/local/apache/logs/access%Y%m_log 86400" common

てなかんじで自動的に分割
あとは月初めに前月分処理後はそのまま残して当月分だけ処理する程度で。。


事後報告をせずにいてスミマセン。
Staff 用の ML でサーバ管理者の方に連絡を取って、設定変更をしてもらいました。
httpd.conf の出力で指定するのではなく、logrotate を使用する形にされています。
# 月初めに…などと毎月確認する手間が出来るのが嫌だからでしょう(サーバ管理者は私じゃないのでこれは推測)。
# 因みに、私のサーバ(当Forum含む)も同様に logrotate で処理しています。

Quote:
参照元はこれを使った方が可搬性がいいと思います。
CustomLog /usr/local/apache/logs/referer_log


これだとStatusCodeが記録されないため、404 以外の正常アクセスとの区別がつかなくなってしまうという問題があります。
単にリファラを確認するのではなく、存在しないファイルに対するリファラが欲しいわけです。
また、毎週100MB以上(先週は約130MB)ものアクセスログが生成されるので、必要以上に需要のないログファイルは作らないようにしているものと思います。
因みに、有名なロボットやワームからのアクセスについては除外するなどしたらログのサイズはかなり縮小できるんですけど、もじら組サーバではそういった処理はされていません。

Quote:
まだリリースされてませんが、バージョン 1.3.30 で加わる ForensicLog の例でこんなん出てきます。
Gecko/20040216 Firefox/0.8
See http://httpd.apache.org/docs/mod/mod_log_forensic.html


Firefox の普及を感じますねぇ。;-)
このモジュールは知りませんでした。面白そうですね。DOS の解析とかがしやすそう。
個人的にはデバッグやハッキング解析用に、ヘッダだけではなく POST メソッド時の Content 部を記録するログが欲しいんですけど、どうすればいいか誰か知りません?
ScriptLog はCGI に対してのみですから PHP などを使用する場合には使えないんですよね…
# ちょっと脱線しすぎか。(笑)
指定期間中に書かれた記事を表示:   
このフォーラムはロックされているため、新規投稿、返信、編集を行うことはできません   このトピックはロックされているため、返信、編集を行うことはできません    Mozilla 翻訳 フォーラム一覧 -> 翻訳部門の活動 All times are GMT +9:00
Page 1 of 1

 
別のフォーラムに移る:  
新規トピックを投稿できます
既存トピックに返信できます
自分の記事を編集できません
自分の記事を削除できません
投票に参加できません


Powered by phpBB © 2001, 2006 phpBB Group (customized by dynamis)

Page generation time: 0.0218s (PHP: 86% - SQL: 14%) - SQL queries: 15