政府「コンピューターで漢字を6万文字使えるようにした、これで日本語の壁が取り払われる」

E6968E
http://hawk.5ch.net/test/read.cgi/livejupiter/1514117814/

1: 風吹けば名無し 2017/12/24(日) 21:16:54.29 ID:WeoWNgz40EVE
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、戸籍で使われているものをはじめおよそ5万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを正確に分析できたりするなどの効果が期待されています。

IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。
https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html?utm_int=news_contents_news-main_001

7: 風吹けば名無し 2017/12/24(日) 21:19:51.59 ID:Xu9ftiHcrEVE
斎藤
斉藤
齊藤

12: 風吹けば名無し 2017/12/24(日) 21:21:08.76 ID:bXwslhw5pEVE
>>7
斎の字ぜってえあんないらんわ

8: 風吹けば名無し 2017/12/24(日) 21:20:16.47 ID:AgyLL5SI0EVE
欠陥言語を直せや

9: 風吹けば名無し 2017/12/24(日) 21:20:26.26 ID:GWqY/6Ye0EVE
ふぉんとぉ?


続きを読む

Source: 金速
政府「コンピューターで漢字を6万文字使えるようにした、これで日本語の壁が取り払われる」