趣味と実益と現実逃避で更新されるblogです.
役に立つことから無意味なことまでさまざま書いていきます.
|
May 11th, 2006 |
これでもmbstringの自動文字エンコード認識を使いますか?(Read: 50567) |
参照: PHP: mb_detect_encoding - Manual |
まぁ無理矢理といえば無理矢理ですが,間違っていません. |
EUC-JPなコンソールでこれを実行してみてください.
$ php -dmbstring.language=Japanese -dmbstring.internal_encoding=EUC-JP -r ' mb_language( "ja"); var_dump( mb_detect_encoding( "あいうえお", "Shift_JIS,UTF-8,EUC-JP,ASCII"));' string(4) "SJIS" みたいに誤認識が簡単に再現できます.文字列をいくら長くしても変わらないようです. これはEUC-JPをShift_JISより先に指定すること,あるいは今の仕様ならautoでも回避できます. $ php -dmbstring.language=Japanese -dmbstring.internal_encoding=UTF-8 -r ' mb_language( "ja"); var_dump( mb_detect_encoding( "あいうえお", "UTF-8,Shift_JIS,EUC-JP,ASCII"));' string(5) "UTF-8" その時「メインは携帯用サイトだから」とついShift_JISを先に書いてしまうかもしれません. これが怖いと思った人は自分で文字エンコード判定処理を入れることをおすすめします. そんなに難しくないですから. #というか自動文字エンコード判定をしないといけないサイトなんてほとんどないと思うんだけどな |
ELF May 11th, 2006 15:16 / [ 編集 ]
[ コメントする ] [ トラックバック(0) ] [ ] |
トピックの参照元 | ▼最近のトピック
| ▼ 人気のトピック |
[ POST ] [ AddLink ] [ CtlPanel ]
<< | 5月 | >> | ||||
日 | 月 | 火 | 水 | 木 | 金 | 土 |
* | 1 | 2 | 3 | 4 | 5 | 6 |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 | * | * | * |