MyMiniCity踏んでください!!

ただいま絶賛MyMiniCity参加中です.是非リンクを踏んでください!!(笑
May 11th, 2006

これでもmbstringの自動文字エンコード認識を使いますか?

(Read: 50258)
Add to Hatena Bookmark

参照: PHP: mb_detect_encoding - Manual
まぁ無理矢理といえば無理矢理ですが,間違っていません.
EUC-JPなコンソールでこれを実行してみてください.


$ php -dmbstring.language=Japanese -dmbstring.internal_encoding=EUC-JP -r '
mb_language( "ja");
var_dump( mb_detect_encoding( "あいうえお", "Shift_JIS,UTF-8,EUC-JP,ASCII"));'
string(4) "SJIS"
なんでShift_JISに?

みたいに誤認識が簡単に再現できます.文字列をいくら長くしても変わらないようです.

これはEUC-JPをShift_JISより先に指定すること,あるいは今の仕様ならautoでも回避できます.


$ php -dmbstring.language=Japanese -dmbstring.internal_encoding=UTF-8 -r '
mb_language( "ja");
var_dump( mb_detect_encoding( "あいうえお", "UTF-8,Shift_JIS,EUC-JP,ASCII"));'
string(5) "UTF-8"
が,携帯とPCのサイトではありがちですね.EUC-JPとShift_JISの併用.
その時「メインは携帯用サイトだから」とついShift_JISを先に書いてしまうかもしれません.

これが怖いと思った人は自分で文字エンコード判定処理を入れることをおすすめします.
そんなに難しくないですから.

#というか自動文字エンコード判定をしないといけないサイトなんてほとんどないと思うんだけどな

トピックの参照元

▼最近のトピック

▼ 人気のトピック


< 過去の記事 [ 5All Categories ] 新しい記事 >
Powered by gsblog (customize)

[ POST ] [ AddLink ] [ CtlPanel ]

Subscribe blog

Bookmark blog

About me

about me

応援しています

我が息子が産まれたアクア・バースハウス(東京都世田谷区にある助産院)を応援しています.

翻訳のお仕事

腕に自信がある方,修行をしたい方はこちらをどうぞ.

2006 calendar

5月
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30 31
| Day | Month | Year |

Powered by RRDTOOL.

Archives

Categories

Links


Mail to admin

人気ブログランキングへ RSS feed meter for http://blog.poyo.jp/ Search Engine Optimization
blogpeople.netに登録!! スカウター : よくきたblog

My Google news

My Google News

Related site

ころんころん♪ べびぽよ フォト蔵Wiki
string(40) "/categ-1/year-2006/month-5/id-1147328204"