PHP, JavaScriptでUnicode文字を数値で指定するメモ。
PHPの引用符はシングルクォートとダブルクォートがある。シングルクォート文字列(以下’文字)とダブルクォート文字列(以下”文字)では利用できるエスケープシーケンスが異なる12。
Unicode文字の数値指定は”文字列でエスケープシーケンスを使う。PHPはUTF-8で符号化したUnicode文字をエスケープシーケンス使い8進数(\[0-7]{1,3})または16進数(\\x[0-9A-Fa-f]{1,2})3で指定する。
» 文字列 – Manual
» Unicode – Wikipedia
PHP”文字列で「あ」を16進数表記と8進数表記で表す
文字 | 16進数表記 | 8進数表記 |
---|---|---|
あ | \xE3\x81\x82 | \343\201\202 |
JavaScriptも’文字列と”文字列がある。PHPとは異なりどちらでもエスケープシーケンスを使いUnicodeを指定できる(\uXXXX)。
PHPと異なりJavaScriptは符号化にUTF-16を使う(\u[0-7]{4})。
文字 | PHP16進数表記(UTF-8) | PHP8進数表記(UTF-8) |
---|---|---|
あ | \xE3\x81\x82 | \343\201\202|\u3042 |
文字 | PHP”文字列エスケープ | JavaScriptエスケープ | URLエンコード | HTML数値文字参照 |
---|---|---|---|---|
水平タブ | \11 (8進数), \x09 (16進数), \t (キャラクター) | \u0009 (16進数), \t(キャラクター) | %09 | |
“ | \42 (8進数), \x22 (16進数), \” (キャラクター) | \u0022(16進数), \”(キャラクター) | %22 | |
あ | \343\201\202 (8進数), \xe3\x81\x82\x0a(16進数) | \u3042 | %E3%81%82 |
» Unicode ~UTF-8、UTF-16との違い~(文字コード関連) | 読み物 | ウナのIT資格一問一答
» UTF8エンコードをデコードする
» 文字列 : PHP | FindxFine -Web制作に関するメモ-
引用符をリテラルとして指定するには、バックスラッシュ (\) でエスケープする必要があります。 バックスラッシュをリテラルとして指定するには、二重 (\\) にします。 それ以外の場面で登場するバックスラッシュは、すべてバックスラッシュそのものとして扱われます。 つまり、\r や \n といったおなじみのエスケープシーケンスを書いても特別な効果は得られず、 書いたままの形式で出力されます。
» 文字列 – Manual
No comments yet.
改行と段落タグは自動で挿入されます。
メールアドレスは表示されません。