Mailman の保存書庫が機種依存文字で文字化けする

Mailman 機種依存文字2
Mailman 機種依存文字3

http://mars.homelinux.net/~kazuhiko/Computer/mailman-gaiji.html

作成: 2006年4月7日 更新: 2007年9月28日

Mailman の保存書庫は日本語の場合には日本語EUCでHTMLが生成されます。が、○数字やローマ数字、1文字の(株)などの機種依存文字を含むメールが投稿されてしまうと、保存書庫の本文はEUCに変換できず、元のメール本文のエンコード、つまりISO-2022-JPのままになってしまいます。 この場合、HTMLのエンコードは日本語EUCになっているので、保存書庫をWebブラウザで見ると文字化けして読めません。

機種依存文字がEUCに変換できないのは Python のライブラリの JapaneseCodec の仕様のようです。外字なんだからエラーとして扱って変換をしない、というのはライブラリという立場からすれば姿勢として間違ってません。

機種依存文字を使ってはいけない、というのはインターネットが広まるよりも昔の、パソコン通信(電子BBS)の頃からのマナーだったのですが。今はそういうことを知らずにEメールに機種依存文字を入れてしまう人は多いですね。

嘆いても仕方ないので Mailman が呼び出す JapaneseCodec のエントリを PyKF を使ったコーデックで上書きする、という、 日本語Mailman利用者メーリングリスト で紹介されていたお手軽な対処方法をやってみました。

参考にしたWebサイト

日本語Mailman利用者ML [mmjp-users 1364] Re: 保存書庫の一部のメールが文字化け
http://mm.tkikuchi.net/pipermail/mmjp-users/2005-April/001364.html

  1. PyKf をインストール。
    1. PyKf はこのコンテンツの添付ファイルをダウンロード。
    2. ソースを適当な作業ディレクトリに展開して、インストールします。
      $ mkdir ~/make
      $ cd ~/make
      $ tar zxvf ~/ftp/pykf-0.3.4.tgz
      $ cd pykf-0.3.4
      $ su
      # python setup.py install
  2. 次にmm_cfg に追加する機種依存文字対策mm_cfg-pykf.txtの設定をします。このコンテンツの添付ファイルにおいてあります。

http://piano.smb.net/~kuji/pukiwiki-1.4.7_notb_utf8/index.php?plugin=attach&pcmd=open&file=mm_cfg-pykf.txt&refer=Mailman%20%E6%A9%9F%E7%A8%AE%E4%BE%9D%E5%AD%98%E6%96%87%E5%AD%971

http://piano.smb.net/~kuji/pukiwiki-1.4.7_notb_utf8/index.php?plugin=attach&pcmd=open&file=pykf-0.3.4.gz&refer=Mailman%20%E6%A9%9F%E7%A8%AE%E4%BE%9D%E5%AD%98%E6%96%87%E5%AD%971

Mailman を再起動して、保存書庫の再構築のコマンドを実行。

$ su
# su - mailman
$ Mailman/bin/arch --wipe メーリングリスト名
FreeBSD
# /usr/local/mailman/bin/arch --wipe test

うまくいきませんでした。



添付ファイル: filepykf-0.3.4.gz 352件 [詳細] filemm_cfg-pykf.txt 630件 [詳細]

トップ   編集 凍結解除 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2007-11-06 (火) 16:02:03