アカウント名:
パスワード:
テキストの途中でRLOを入れれるような仕様にしたのが全ての間違い。先頭1文字目でのみ許可されるようにすべきだった。
先頭1文字目でのみ許可だと英語とアラビア語が混在する文章が作れないではないか
そんなわけのわからない文章を作らなければいいのでは
タイトルの時点で日本語と英単語交じりという……アラビア語文書に英単語混ぜるという視点で見れば?# RLOでなくLROダケド
日本語に英数字を混ぜるのもやめましょう
あなたは英単語まじりの日本語を見たことはありませんか? わけのわからないことを言わないように。
日本語話者が言うとギャグにしかならないんだが
UnicodeにRLOの機能を持たせたのが間違いだ。
RLOの制御文字がない文字コードでどうやって英語とアラビア語を混在表示しようというのだ。
英語とアラビア語が混在する普通の文章を作るだけなら、 explicit directional override (RLO, LRO) は不要で、 implicit directional mark (RLM, LRM) や explicit directional embedding (RLE, LRE) で十分だと思います。 explicit directional override にも使い道はあるようですが、よく知りません。
Unicodeは文字セットなのに文字列に関することが出てくるというのが仕様としてどうよ。// 他に文字列に関するものってあったっけ。
制御文字に関していえば、文字列(制御文字で囲まれた文字)の操作に関するものは山ほどありますよ。別にUnicodeに限った話でなく。
なんで32bitも領域があるのに、制御コードが必要なの?単純にそのコードを見れば、英字なのか、アラビア文字なのか、判別できますよね。描画するときに、左からなのか、右からなのか、判断すれば良いでしょ。
なんで32bitも領域があるのに、制御コードが必要なの?
その二つは関係ない気がする。あと、くだらない揚げ足取りをすると、 Unicode のコードポイントは 0x10FFFF までだから 32 ビットもない。 20 ビットちょい。
単純にそのコードを見れば、英字なのか、アラビア文字なのか、判別できますよね。 描画するときに、左からなのか、右からなのか、判断すれば良いでしょ。
その判断はするけれど、 bidi の処理って意外と複雑だから、それだけじゃ済まないんだよ。感嘆符等、方向のない文字もあるし、制御文字を除いて同じ文字列でも状況によって方向が変わったりする。例えば、英語のソフトウェアの中でアラビア語の単語が 3 個並んでいたとして、 3 個の単語が一つのフレーズを成すなら右から左に並べるけれど、各単語が別個の選択肢を表しているなら左から右に並べるとか。
bidi 制御文字がなくても何とかする方法はあるだろうけれど、少なくとも bidi 制御文字が使えて便利な場面はある。
君は若いから知らないのかもしれないが、昔は日本語もRLOだったんだよ。つまり、単純に日本語だからと言って、LROで表示すればいいってことは無い。
ちなみに、牛耕式 [wikipedia.org]って書き方もあるね。
君は若いから知らないのかもしれないが、昔は日本語もRLOだったんだよ。
「RLO」というのは Unicode の制御文字の名前「right-to-left override」の略称であって、 right-to-left reading order か何かの略じゃない…はず。
さらに補足しておくと、現代日本語でも、RLOで書くことがある。例えば、自動車の右側に横書きで書く場合。
湘南FLOWER
。だのういとうよし示表在混を語アビラアと語英てっやうこでドーコ字文いなが字文御制のOLR| rev
アルファベット文字なのに逆並びが指定できるのがおかしいのだから解釈する側が逆順にならないFONT(アルファベットとか漢字とか)では無視するなどの処理を行うべきなんだろう。
先頭にRLO制御文字を加えた「etadpug」という文字列
なので、それじゃ駄目なのでは。
マークアップ言語やアプリケーション側で制御をするのが良かったと思う。ルビとか上付き・下付き文字みたいに
確かに、結局、RLOなどの制御文字を入れるんだったら、Unicodeじゃなくて、ISO-2022-JPなどの様に切り替えシーケンスで複数のエンコードを切り替えるという仕様でも良かった気はします。
ただ、それだとエンコード毎にアドホックな対応が必要で実装が大変だから、統合しようぜってことだったんでしょうけど、結局、Unicodeの仕様は大きすぎて、もうOSやらライブラリに頼らないと、一般のプログラマには手に負えないという・・・。
あれほどUnicodeマンセーしてた奴らがw
全てはバベルの塔を建てようとした事が間違いだった。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
RLOはUnicodeの仕様バグ (スコア:0)
テキストの途中でRLOを入れれるような仕様にしたのが全ての間違い。
先頭1文字目でのみ許可されるようにすべきだった。
Re:RLOはUnicodeの仕様バグ (スコア:1)
先頭1文字目でのみ許可だと英語とアラビア語が混在する文章が作れないではないか
Re:RLOはUnicodeの仕様バグ (スコア:2, おもしろおかしい)
そんなわけのわからない文章を作らなければいいのでは
Re:RLOはUnicodeの仕様バグ (スコア:2)
わけがわかるように修正お願い
Re:RLOはUnicodeの仕様バグ (スコア:1)
タイトルの時点で日本語と英単語交じりという……
アラビア語文書に英単語混ぜるという視点で見れば?
# RLOでなくLROダケド
Re: (スコア:0)
日本語に英数字を混ぜるのもやめましょう
Re: (スコア:0)
あなたは英単語まじりの日本語を見たことはありませんか? わけのわからないことを言わないように。
Re: (スコア:0)
日本語話者が言うとギャグにしかならないんだが
Re: (スコア:0)
UnicodeにRLOの機能を持たせたのが間違いだ。
Re: (スコア:0)
RLOの制御文字がない文字コードでどうやって英語とアラビア語を混在表示しようというのだ。
Re:RLOはUnicodeの仕様バグ (スコア:2)
英語とアラビア語が混在する普通の文章を作るだけなら、 explicit directional override (RLO, LRO) は不要で、 implicit directional mark (RLM, LRM) や explicit directional embedding (RLE, LRE) で十分だと思います。 explicit directional override にも使い道はあるようですが、よく知りません。
Re: (スコア:0)
Unicodeは文字セットなのに文字列に関することが出てくるというのが仕様としてどうよ。
// 他に文字列に関するものってあったっけ。
Re: (スコア:0)
制御文字に関していえば、
文字列(制御文字で囲まれた文字)の操作に関するものは山ほどありますよ。
別にUnicodeに限った話でなく。
Re: (スコア:0)
なんで32bitも領域があるのに、制御コードが必要なの?
単純にそのコードを見れば、英字なのか、アラビア文字なのか、判別できますよね。
描画するときに、左からなのか、右からなのか、判断すれば良いでしょ。
Re:RLOはUnicodeの仕様バグ (スコア:2)
その二つは関係ない気がする。あと、くだらない揚げ足取りをすると、 Unicode のコードポイントは 0x10FFFF までだから 32 ビットもない。 20 ビットちょい。
その判断はするけれど、 bidi の処理って意外と複雑だから、それだけじゃ済まないんだよ。感嘆符等、方向のない文字もあるし、制御文字を除いて同じ文字列でも状況によって方向が変わったりする。例えば、英語のソフトウェアの中でアラビア語の単語が 3 個並んでいたとして、 3 個の単語が一つのフレーズを成すなら右から左に並べるけれど、各単語が別個の選択肢を表しているなら左から右に並べるとか。
bidi 制御文字がなくても何とかする方法はあるだろうけれど、少なくとも bidi 制御文字が使えて便利な場面はある。
Re:RLOはUnicodeの仕様バグ (スコア:1)
君は若いから知らないのかもしれないが、昔は日本語もRLOだったんだよ。
つまり、単純に日本語だからと言って、LROで表示すればいいってことは無い。
ちなみに、牛耕式 [wikipedia.org]って書き方もあるね。
Re:RLOはUnicodeの仕様バグ (スコア:2)
「RLO」というのは Unicode の制御文字の名前「right-to-left override」の略称であって、 right-to-left reading order か何かの略じゃない…はず。
Re:RLOはUnicodeの仕様バグ (スコア:1)
さらに補足しておくと、現代日本語でも、RLOで書くことがある。例えば、自動車の右側に横書きで書く場合。
Re: (スコア:0)
Re: (スコア:0)
湘南FLOWER
Re: (スコア:0)
。だのういとうよし示表在混を語アビラアと語英てっやうこでドーコ字文いなが字文御制のOLR
| rev
Re: (スコア:0)
アルファベット文字なのに逆並びが指定できるのがおかしいのだから
解釈する側が逆順にならないFONT(アルファベットとか漢字とか)では
無視するなどの処理を行うべきなんだろう。
Re: (スコア:0)
先頭にRLO制御文字を加えた「etadpug」という文字列
なので、それじゃ駄目なのでは。
Re: (スコア:0)
マークアップ言語やアプリケーション側で制御をするのが良かったと思う。
ルビとか上付き・下付き文字みたいに
Re: (スコア:0)
確かに、結局、RLOなどの制御文字を入れるんだったら、Unicodeじゃなくて、ISO-2022-JPなどの様に切り替えシーケンスで複数のエンコードを切り替えるという仕様でも良かった気はします。
ただ、それだとエンコード毎にアドホックな対応が必要で実装が大変だから、統合しようぜってことだったんでしょうけど、結局、Unicodeの仕様は大きすぎて、もうOSやらライブラリに頼らないと、一般のプログラマには手に負えないという・・・。
Re: (スコア:0)
あれほどUnicodeマンセーしてた奴らがw
Re: (スコア:0)
全てはバベルの塔を建てようとした事が間違いだった。