文字コードの基礎をまとめます。
文字コードとは文字を表すコード(本来数値でない情報を数値で表したもの)です。文字コードは一般に16進数(または8進数)で表記されます。
文字 | 16進数 |
" | 0x22 |
‘ | 0x27 |
多くの場合、16進数を明示するために先頭に0xを付けます。
同様に8進数の場合は先頭に0を付ける場合が多いです。
2進数の16 ⇒10000
8進数の16 ⇒020
10進数の16 ⇒16
16進数の16 ⇒0x10
ASCII | 英語の基本的な文字コード |
以下日本語文字コード | |
JIS | メールなどで使われている文字コード |
Shift_JIS | Windows上で日本語表す一般的な文字コード |
EUC-JP | Unix上で一般的に使われる文字コード |
Unicode | プラットフォーム非依存で世界共通の汎用的な利用を目指す文字コード |
1文字を7ビットで表す文字コード体系であり128文字を表現可能であり16進数0x00~0x7Fを使って表されることが多い。この128文字は上記表にある他の文字コード体系でも同じ数字が当てられている。
ASCIIの具体例
文字コード | 対応文字 |
---|---|
0x00 | NUL |
0x0A | 改行 |
0x0D | 復帰 |
0x20 | 半角スペース |
" | \x22 |
‘ | \x27 |
0x30 | 0 |
0x41 | A |
0x61 | a |
参考URL
»ASCII文字コード
ここでいう改行は文字コード0x0Aそのものではなく、Enterキーを押した場合などの実際の改行のこと。実際の改行はOSごとに異なる(文字コード体系ごとではなく)。
Unix | 文字通り0x0A(LF)で改行を表す。 |
Windows | 0x0D\x0A(CRLF)で改行を表す |
Mac | 0x0D |
HEXとはHexadecimalの略で16進数をあらわす。
No comments yet.
改行と段落タグは自動で挿入されます。
メールアドレスは表示されません。