この記事では、「ascii」と「utf-8」の違いを分かりやすく説明していきます。
「ascii」とは?
「ascii」は、起訴中の基礎の文字コードで、キーボードの数字やアルファベットの文字を1バイトで表示可能とした文字コードです。
文字コードについては、簡単に説明しますと、コンピューターが元々文字を数字に起こして文字とするのですが、例えば、Zというアルファベットは、コンピューターの言語では、1111010という数字になりこの数字の集まりを文字コードと呼びます。
「ascii」の使い方
「ascii」の使い方は、コンピューター上で文字を他のコンピューターに理解してもらう際に使用します。
つまりは、人間の場合、英語を話す人物が日本語を理解できない場合、英語で話す必要性があり、「ascii」とは、その英語や日本語という言語そのもので、言葉を合わせることでコンピューターが数字を文字として認識できるように翻訳するために、この「ascii」を使用します。
「utf-8」とは?
「utf-8」はアルファベットの文字や日本語という世界中の文字をコンピューター側が理解できるようにした言語に当たり、2バイトの文字コードです。
現在はこちらの文字コードがスタンダードとなっており、世界中の文字をパソコンが文字であると認識できるようにした文字コードです。
「utf-8」の使い方
「utf-8」は、日本語やアラビア語など様々な言語をパソコンで打ち込む場合使用する文字コードでこれを利用することで日本語やアラビア語など多数の言葉を意識することなくパソコンのメモ帳などに記載するために使用します。
なお、作り出した文字のフォーマットを「utf-8」で保存することで、コンピューターはこの文字は、「utf-8」で書かれており、このデータは何の言葉で書かれているかを正確に理解しますので、きちんとフォーマットが「utf-8」になっていなければ、日本語やアラビア語で書かれた文字はよくわからない数字の集まりとしてコンピューターは認識しますので俗にいう、文字化けになります。
「ascii」と「utf-8」の違い
「ascii」と「utf-8」の違いは、日本語やアラビア語など世界中の文字をコンピューターが文字として理解できるようにしたか、アルファベットと数字だけを理解するとしたがです。
その為、「ascii」では、日本語は文字化けしますが、「utf-8」ではきちんと文字として認識しますので、違いは文字の認識になります。
まとめ
「ascii」と「utf-8」の他、「shift-JIS」など、人間が理解できる文字に変換することができるのが、これら、文字コードです。
この文字コードは、いわば翻訳表で、最初にコンピューターにどの文字であるかを理解させることで、コンピューターは単に文字を数字の集まりとしてみるのではなく、文字にすることができると理解します。
このコードが生まれるに従い、日本語での入力を可能としたり、見たこともないような文字をコンピューターを通して、これは文字であると理解できるようにすることができるのです。