RLOはUnicodeの仕様バグ (#2446906) | RLOを使いレジストリ汚染を隠ぺいするマルウェア

「RLOを使いレジストリ汚染を隠ぺいするマルウェア」記事へのコメント

記事ページを表示すべてのコメント取得

検索56コメント Log In/Create an Account

RLOはUnicodeの仕様バグ (スコア:0)

by Anonymous Coward on 2013年08月23日 19時19分 (#2446906)

テキストの途中でRLOを入れれるような仕様にしたのが全ての間違い。
先頭1文字目でのみ許可されるようにすべきだった。
- Re:RLOはUnicodeの仕様バグ (スコア:1)
  
  by Anonymous Coward on 2013年08月23日 19時25分 (#2446910)
  
  先頭1文字目でのみ許可だと英語とアラビア語が混在する文章が作れないではないか
  
  シェア
  
  親コメント
  - Re:RLOはUnicodeの仕様バグ (スコア:2, おもしろおかしい)
    
    by Anonymous Coward on 2013年08月23日 19時33分 (#2446917)
    
    そんなわけのわからない文章を作らなければいいのでは
    
    シェア
    
    親コメント
    - Re:RLOはUnicodeの仕様バグ (スコア:2)
      
      by ncaq (46027) <ncaq@ncaq.net> on 2013年08月23日 22時27分 (#2447011) ホームページ
      
      https://ja.wikipedia.org/wiki/%E3%83%A0%E3%83%8F%E3%83%B3%E3%83%9E%E3%83%89%E3%83%BB%E3%83%A0%E3%83%AB%E3%82%B7%E3%83%BC
      わけがわかるように修正お願い
      
      シェア
      
      親コメント
    - Re:RLOはUnicodeの仕様バグ (スコア:1)
      
      by Anonymous Coward on 2013年08月23日 20時23分 (#2446948)
      
      タイトルの時点で日本語と英単語交じりという……
      アラビア語文書に英単語混ぜるという視点で見れば？
      # RLOでなくLROダケド
      
      シェア
      
      親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      日本語に英数字を混ぜるのもやめましょう
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      あなたは英単語まじりの日本語を見たことはありませんか？わけのわからないことを言わないように。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      日本語話者が言うとギャグにしかならないんだが
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    UnicodeにRLOの機能を持たせたのが間違いだ。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      RLOの制御文字がない文字コードでどうやって英語とアラビア語を混在表示しようというのだ。
      - Re:RLOはUnicodeの仕様バグ (スコア:2)
        
        by fcp (32783) on 2013年08月23日 21時09分 (#2446973) ホームページ日記
        
        英語とアラビア語が混在する普通の文章を作るだけなら、 explicit directional override (RLO, LRO) は不要で、 implicit directional mark (RLM, LRM) や explicit directional embedding (RLE, LRE) で十分だと思います。 explicit directional override にも使い道はあるようですが、よく知りません。
        
        シェア
        
        親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        Unicodeは文字セットなのに文字列に関することが出てくるというのが仕様としてどうよ。
        // 他に文字列に関するものってあったっけ。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        制御文字に関していえば、
        文字列（制御文字で囲まれた文字）の操作に関するものは山ほどありますよ。
        別にUnicodeに限った話でなく。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        なんで32bitも領域があるのに、制御コードが必要なの？
        単純にそのコードを見れば、英字なのか、アラビア文字なのか、判別できますよね。
        描画するときに、左からなのか、右からなのか、判断すれば良いでしょ。
        
        Re:RLOはUnicodeの仕様バグ (スコア:2)
        
        by fcp (32783) on 2013年08月23日 21時29分 (#2446985) ホームページ日記
        
        なんで32bitも領域があるのに、制御コードが必要なの？
        
        その二つは関係ない気がする。あと、くだらない揚げ足取りをすると、 Unicode のコードポイントは 0x10FFFF までだから 32 ビットもない。 20 ビットちょい。
        単純にそのコードを見れば、英字なのか、アラビア文字なのか、判別できますよね。
        描画するときに、左からなのか、右からなのか、判断すれば良いでしょ。
        
        その判断はするけれど、 bidi の処理って意外と複雑だから、それだけじゃ済まないんだよ。感嘆符等、方向のない文字もあるし、制御文字を除いて同じ文字列でも状況によって方向が変わったりする。例えば、英語のソフトウェアの中でアラビア語の単語が 3 個並んでいたとして、 3 個の単語が一つのフレーズを成すなら右から左に並べるけれど、各単語が別個の選択肢を表しているなら左から右に並べるとか。
        bidi 制御文字がなくても何とかする方法はあるだろうけれど、少なくとも bidi 制御文字が使えて便利な場面はある。
        
        シェア
        
        親コメント
        
        Re:RLOはUnicodeの仕様バグ (スコア:1)
        
        by Ryo.F (3896) on 2013年08月23日 23時59分 (#2447068) 日記
        
        君は若いから知らないのかもしれないが、昔は日本語もRLOだったんだよ。
        つまり、単純に日本語だからと言って、LROで表示すればいいってことは無い。
        ちなみに、牛耕式 [wikipedia.org]って書き方もあるね。
        
        シェア
        
        親コメント
        
        Re:RLOはUnicodeの仕様バグ (スコア:2)
        
        by fcp (32783) on 2013年08月24日 10時26分 (#2447189) ホームページ日記
        
        君は若いから知らないのかもしれないが、昔は日本語もRLOだったんだよ。
        
        「RLO」というのは Unicode の制御文字の名前「right-to-left override」の略称であって、 right-to-left reading order か何かの略じゃない…はず。
        
        シェア
        
        親コメント
        
        Re:RLOはUnicodeの仕様バグ (スコア:1)
        
        by Ryo.F (3896) on 2013年08月24日 0時01分 (#2447069) 日記
        
        さらに補足しておくと、現代日本語でも、RLOで書くことがある。例えば、自動車の右側に横書きで書く場合。
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        あれは横書きではなくて縦書きだという説。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        湘南FLOWER
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        。だのういとうよし示表在混を語アビラアと語英てっやうこでドーコ字文いなが字文御制のOLR
        | rev
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      アルファベット文字なのに逆並びが指定できるのがおかしいのだから
      解釈する側が逆順にならないFONT（アルファベットとか漢字とか）では
      無視するなどの処理を行うべきなんだろう。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  先頭にRLO制御文字を加えた「etadpug」という文字列
  なので、それじゃ駄目なのでは。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  マークアップ言語やアプリケーション側で制御をするのが良かったと思う。
  ルビとか上付き・下付き文字みたいに
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    確かに、結局、RLOなどの制御文字を入れるんだったら、Unicodeじゃなくて、ISO-2022-JPなどの様に切り替えシーケンスで複数のエンコードを切り替えるという仕様でも良かった気はします。
    ただ、それだとエンコード毎にアドホックな対応が必要で実装が大変だから、統合しようぜってことだったんでしょうけど、結局、Unicodeの仕様は大きすぎて、もうOSやらライブラリに頼らないと、一般のプログラマには手に負えないという・・・。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      あれほどUnicodeマンセーしてた奴らがw
- Re: (スコア:0)
  
  by Anonymous Coward
  
  全てはバベルの塔を建てようとした事が間違いだった。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

RLOを使いレジストリ汚染を隠ぺいするマルウェア More ログイン

「RLOを使いレジストリ汚染を隠ぺいするマルウェア」記事へのコメント

RLOはUnicodeの仕様バグ (スコア:0)

Re:RLOはUnicodeの仕様バグ (スコア:1)

Re:RLOはUnicodeの仕様バグ (スコア:2, おもしろおかしい)

Re:RLOはUnicodeの仕様バグ (スコア:2)

Re:RLOはUnicodeの仕様バグ (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:RLOはUnicodeの仕様バグ (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:RLOはUnicodeの仕様バグ (スコア:2)

Re:RLOはUnicodeの仕様バグ (スコア:1)

Re:RLOはUnicodeの仕様バグ (スコア:2)

Re:RLOはUnicodeの仕様バグ (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

スラド