二次元裏@ふたば

画像ファイル名:1762068202390.jpg-(382612 B)
382612 B25/11/02(日)16:23:22No.1368768281そうだねx1 17:43頃消えます
文字コードのこと完全に理解した
このスレは古いので、もうすぐ消えます。
125/11/02(日)16:23:41No.1368768368そうだねx4
sugoi
225/11/02(日)16:33:46No.1368771510そうだねx6
サロゲートペア文字のこと完全に理解した
UTF-16エンコーディング文字であることが確定していて
エンディアンも特定できている(LEでもBEでも)とき、
2バイトの16bitのうち
先頭6bit(最上位(最左)bitから数えて6bit)が
110110(上位サロゲート)か110111(下位サロゲート)ならサロゲートペア文字(の符号のどちらか)です
完全に理解した
325/11/02(日)16:34:18No.1368771728そうだねx4
日本語でおk
425/11/02(日)16:36:51No.1368772804そうだねx7
プログラマだけでなく全てITエンジニアが理解するべき
525/11/02(日)16:37:29No.1368773039そうだねx1
果たして絵文字の合成も理解できてるかな?
625/11/02(日)16:38:46No.1368773635+
shift-jisお前だったのか
JIS X 0201 片仮名集合(半角カナ,1byteカナ)を守ってくれていたのは
(電子メールでは半角カナは使えません)
725/11/02(日)16:39:08No.1368773810そうだねx1
全文字3バイト以下であれ
825/11/02(日)16:40:03No.1368774194そうだねx3
>果たして絵文字の合成も理解できてるかな?
複数の規格が混在するだけでもすごいのに二つの文字を合成して一文字を作ってるとかどうしてこんな複雑な仕組みを作ったの…
なお上の内容は私の理解が間違っているかもしれませんが悪しからずご了解ください。
925/11/02(日)16:41:16No.1368774675そうだねx4
昔は会社ごと違うガラケーの絵文字を力技で解決したりしてた気がする
滅んでよかった
1025/11/02(日)16:44:21No.1368776006+
>全文字3バイト以下であれ
あんまり1byteに符号位置を詰め込みすぎるとshiftjisと同じ轍を踏むから
人類はUCS-4(すべての文字が4byte固定)に回帰すべき
1125/11/02(日)16:55:26No.1368780559+
👨‍👩‍👧‍👦
1225/11/02(日)16:57:47No.1368781474+
𠮷野家
433(UTF-8換算)
422(UTF-16換算)
1325/11/02(日)16:58:35No.1368781745+
汎用機のことも書いてる?
1425/11/02(日)16:58:47No.1368781815そうだねx1
👨‍👩‍👧‍👦ḍé𠮷野家
1525/11/02(日)17:01:02No.1368782573そうだねx1
2つの文字で1文字という認識は危うい
正確には2つ以上の文字だ
1625/11/02(日)17:01:39No.1368782779+
>汎用機のことも書いてる?
スレ画には
EBCDICについては扱いません
ってコメントがある
1725/11/02(日)17:03:18No.1368783381+
>👨‍👩‍👧‍👦ḍé𠮷野家
もうね、アホかと。バカかと。
1825/11/02(日)17:11:14No.1368786425+
文字コードはなぜ魔境になってしまうのか
1925/11/02(日)17:22:18No.1368790836+
UTF-16使った方がいいんだろうけど無駄に領域奪うのが邪魔すぎる
2025/11/02(日)17:26:00No.1368792432+
>文字コードはなぜ魔境になってしまうのか
俺の考えた最高の定義!が複数あるからですかね…
2125/11/02(日)17:26:12No.1368792519+
もっとこうスマートに出来なかったんですか?の連続
2225/11/02(日)17:28:42No.1368793566+
考えてほしい
文字コード黎明期の不安定な通信技術で成されるインターネットを…
重要な文脈で文字化けが観察されてしまう世界を…
そしてそのようなインターネットで
最高にエロいネット小説がMicrosoftコードページ932で書かれていたなら…と…
BETAMAXとVHSの光と影もまさにそこにあった。一説によると「エロVHSが市場を支配したがためにBETAMAXを駆逐した」と言われている。
文字コードの歴史とはまさに「市場の要求に応えられないコード体系の駆逐」の歴史なのだ…
2325/11/02(日)17:29:35No.1368793882+
ブラウザで文字化けることはほぼなくなったし…
2425/11/02(日)17:31:34No.1368794603+
Unicodeも漢字に関してはやっちゃってるがもうこいつと付き合うしか無い
漢字を使っている民族が悪い
2525/11/02(日)17:33:04No.1368795180+
大体どこの仕様も一瞬だけ節約サイコー!ってなったときにやらかしたこと引きずるんだよな…
節約はクソです
2625/11/02(日)17:33:27No.1368795318+
ありえない組み合わせのハングルとか作るな
削除しろ
2725/11/02(日)17:34:14No.1368795597+
読もうと思って積んでる本だ…
どのくらいで通読できた?
2825/11/02(日)17:34:46No.1368795799+
こいつにSJISとBOMなしUTF-8を食わしてやりたいんですが構いませんねッ!
2925/11/02(日)17:35:02No.1368795898そうだねx1
中国も日本も韓国も同じ漢字は同じ字体でしょ(笑)
3025/11/02(日)17:36:50No.1368796593+
ゆる言語学ラジオの文字コード解説会面白かった
事の発端が言語学で本出そうぜ!からの誤植発生で
誤植がなぜ起きたのかを考えていく会
3125/11/02(日)17:37:20No.1368796739+
>大体どこの仕様も一瞬だけ節約サイコー!ってなったときにやらかしたこと引きずるんだよな…
早すぎる最適化は地獄の入り口
全人類が使う文字数え上げてから決めるべきだった(永遠に決まらない仕様)
3225/11/02(日)17:38:38No.1368797231+
ある言語の解説すなわちメタ言語は対象の言語とは別の言語使うほうが便利


1762068202390.jpg