文字コード|メール・メルマガ配信システムのパイプドビッツ

お電話でも承っております。03-5779-6331/06-6228-7410

用語集

文字コード

コンピュータは文字を扱う場合、文字を数値に変換して処理を行う。
文字コードとは、この変換の際に使用するそれぞれの文字と数値を1対1に 関係付ける規則の集合である。

補足と見解

ユーザの皆様は「文字化け」という言葉をよく耳にされると思います。
例えば、メールやWEBサイトなどの全体、あるいは一部に意味不明な文字が 表示される現象です。

文字化けの原因はいくつかありますが、その1つとして複数の文字コードが 存在することが挙げられます。日本語の文字コードだけでも、日本工業規格 (JIS)で標準化されたJISコード、主にUNIX環境で使用されるEUC_JP、 WindowsやMac OSなどで使用されるShift_JISの3種類があります。例えば WEBサイトを閲覧するとき、EUC_JPで記述されたページを何らかの理由で ブラウザがShift_JISだと誤認識した場合などに文字化けが発生します。
これはページ全体が文字化けする例です。

一部の文字が文字化けする(代替文字に置き換わる)、もしくは文字が 欠ける原因として、いわゆる機種依存文字の存在が挙げられます。例えば 囲み数字(まるいち、まるに等)やギリシャ数字、いわゆる梯子高 (なべぶたの下の口を梯子のような形に置き換えた文字)など一部の 漢字がそうです。これらの文字は各ベンダーが独自に拡張したため、 Windowsでは表示できるが、他のOSでは表示できないなどの問題があり、 インターネットでは使用すべきではないとされています。しかし現実問題 として、多くのエンドユーザはこういった問題を意識することなく 機種依存文字を使用します。

一方で、WEB上の登録機能でこれらの文字を落とすシステムもあるようです。
多くの場合、フォームからはShift_JISでデータを取得し、メールは JISコードで配信するため、文字コード変換が必要になります。 しかし、一般に普及している文字コード変換ツールでは機種依存文字を 扱うことができません。この場合、メールに名前を差込んで配信すると、 梯子高の「高橋」さまは「橋」さまになり、エンドユーザに不快感を 与えます。これは非常に大きな問題です。

スパイラルでは、この問題を重要視し、独自に文字コード変換ツールを 開発しているため、機種依存文字は欠落しません。また、ユーザ様の サイトにフォームを設置する場合、既存のサイトに合わせて上記3種類の 文字コードを自由に使用できるという点も大きな特徴の1つです。

最近では、世界の主要な言語のほとんどの文字を収録したUnicodeの 規格化が進み、多くのサイトで利用されています。現在、スパイラルでも 各国語対応を目指し、Unicodeへの対応を進めています。

50音順

A - E F - J K - O P - T U - Z 数字

  • 用語集