享(サム本人)'s profile古川 享 ブログPhotosBlog Tools Help
    February 14

    MS IMEさらに...お馬鹿になっていく

    またMS IMEの辞書が壊れたか、もしくは「MS IMEスイッチ」...実は、"使い込むほどお馬鹿になって壊れていく"仕様になっているのか知りませんが...MS内部では、「古川の言っていることは再現性が無い」ってことになっているそうですが..何度でもMS IMEの辞書壊れますよぉーっ..電源スイッチを”長尾氏”(長押し?)したり、動作中のアプリケーションが”新だ”(死んだ)後に強制終了すると、毎回このような”ご変換”(誤変換)に悩まされることになるのです。

    検証苑 "腱鞘炎"とどうしても変換入力できないので、検索エンジンでネットにて検索してコピペしました

    社零 どう変換しても”謝礼”になりません

    社れ記 ”社歴”も変換できません、次候補は「舎れ記」ですと...「舎れにもなっていない」と、"洒落”も変換できない...

    上記機関車 浄机機関車 じゃなくて、”蒸気機関車”だってばぁ、まぁ普通の人は一生のうちに何回も蒸気機関車って変換する機会はそうそうないのだろうけれど..そもそも、”浄机”ってなによ? "きれいに片付けられた机”だと、そんなもんは私の辞書にはないっ! 普段から私の机の上はバッチぃからねぇ...”常軌を逸した”は一発で変換するのに、”蒸気を参照して”は"上記”でしょ、”顔は蒸気して”や”上記言”と変換されては”上機嫌”にはなれないよねぇ..

    西英副  「西永福」の変換がこれじゃ、毎回「西永福」と変換するのは大変だろうに...「西 永福」と変換してバックスペースで空白を消さないと入力できず...”Tabを押すと予測変換ができます”、と表示して「西英副」と何回も表示するのは笑えない。そんな名前の有名人がいるとも思えないし...

    感じの予測変換 "漢字”と正しく変換して辞書順位を上げても、いつも”感じ”が第1候補に表示されるのは、何故? ”かんじのごへんかん”を"感じの誤変換”と毎回表示するのは再現性100%なんですけれど...

    ブログ 今まで毎回”部ログ”と変換されたのに、”ブログ”と変換されるようになったのは、最近とてつもなく大きなサイズのWindows updateをした後にOffice もSP1になってなにやら変換機能が明らかに異なる..つまり、毎回「部ログ」では格好が悪いので、辞書をコッソリ修正したら他の変換がお馬鹿になったのかな? 大体、MS IMEがWindows Vistaの版と、Office 2007に付いてくるものと異なる仕様だって話を一体誰が知っているのでしょうか?お互いに、それはあっちのせいじゃないの?と言うのは、そちらの都合でしょ?!?

    某MS社員に、「MS IME最近どうなっているのよ?」と先週聞いた答えが...「IME開発の主体が、中国にシフトしまっていて我々も手を出せない......個人的にはATOKに切り替えようと思っている」と言う現役開発系社員の発言に絶句!!! 

    4兆円を超える金でYahoo買おうという発想があるならその数10分の1でも、IMEの品質向上に自ら開発投資をするべきで...本来IMEは、かな漢字変換としての機能だけではなく...正しい漢字を検索する、自分のファイルやデータをローカルファイルの中から検索する、企業内部で共通辞書や住所、顧客データなどを検索する、社会のデータベースやインターネット上の情報を検索するに必要な共通技術であるにも関わらず...まぁ、そんなことが理解できない経営者が...IMEの開発は中国でやった方が安く済むと思っているのであれば、未来は無いねぇ...

    MSのモットーは「Eat Your Own Dog Food」(人にドッグフードを勧める前に、まず自分で食ってみろ!)だったはずなのに、”犬も食わない”って話かよーっ...きっと藤村さんが、泣いてるぜよ!!!

    では、ふるかわでした

    P.S. あなたの見つけた誤変換、コメントで募集します...

     

    Comments (27)

    Please wait...
    Sorry, the comment you entered is too long. Please shorten it.
    You didn't enter anything. Please try again.
    Sorry, we can't add your comment right now. Please try again later.
    To add a comment, you need permission from your parent. Ask for permission
    Your parent has turned off comments.
    Sorry, we can't delete your comment right now. Please try again later.
    You've exceeded the maximum number of comments that can be left in one day. Please try again in 24 hours.
    Your account has had the ability to leave comments disabled because our systems indicate that you may be spamming other users. If you believe that your account has been disabled in error please contact Windows Live support.
    Complete the security check below to finish leaving your comment.
    The characters you type in the security check must match the characters in the picture or audio.
    享(サム本人) has turned off comments on this page.
    Wings.ATwrote:
    IME2003(XP)とIME2007(Vista)、ATOK2008を使用していますが、IME2003でリカバリを標準入力(スペースキーでの変換)を行った場合「理科張り」と変換されます。
    最新のIME2007ではリカバリと表示されますが・・・
    個人的な意見ですが、日本語入力は標準搭載のMS-IMEはWin95時代のATOK8よりも変換性能が悪いのでは?と思えるぐらいです。
    MS-IMEの利点が、カタカナ→英語の変換ぐらいしかないように思えてきました・・・
    July 30
    Picture of Anonymous
    トレントII wrote:
    MS-IME2003を使用していますが、長押し 死んだ 誤変換 腱鞘炎 など普通に一発変換できるのですが・・・
    漢字の誤変換 も学習しますね。 なんでそんな違うのでしょうか?
     
    但しこのバージョンに限るのかもしれませんが、MS-IMEにはほとほと困っているバグがあります。
    私はカナ入力なのですが、このようなIEのフォームに入力する際漢字変換で第一候補でない次候補を
    選んだ場合100%何故か勝手にローマ字入力に切り替わってしまいます。
     
    もう最近は直接入力せずにエディタで打ってからフォームにコピーしてますけどね。
    IE6だと起こらないんですが、IE7+IME2003だとだめですね。
    ずっと前にMSさんにメールしたこともあるんですがいまだに直りません。
    May 24
    Picture of Anonymous
    らびっと wrote:
    自分は15年前から一太郎&ATOKを使用しています。
    このブログを見て久しぶりにMS-IMEに切り換えて入力し、かなり笑わせてもらいました。

    MS-IMEのバカ変換には初めからついて行けず、
    周りのみんなが一太郎→WORDへシフトしていった時も、そして今もずっと一太郎派を貫いています。
    (PCにはWORDも入っていますが……)
    MS-IMEもWindowsができたての頃よりはだいぶんマシになりましたが、ATOKも最初よりもっと良くなっており、比較にもなりません。
    みんなにATOKの良さをもっと知って欲しいです。
    May 22
    Picture of Anonymous
    (名前なし) wrote:
    ATOK(ジャストシステム製の日本語入力システム)を使って好感触を得たとおぼしきコメントが散見されます。
    ネット上を見渡しましても、2008年2月発売のATOK 2008 for Windowsはおおむね評判がよいようです。

    果たして実際によいものなのか、それほどでもないのか。
    30日間無償で使えるATOK 2008 for Windows体験版が登場しました。
    http://www.justsystems.com/jp/products/atok/download.html

    IME(Input Method Editor)はPCにおける筆記具と言えましょう。
    変換精度以外に、操作の感覚が自分の手になじむかどうかが非常に大切です。
    ATOKに興味を持たれた方は体験版をお試しになってみてはいかがでしょうか。
    Apr. 12
    No namewrote:
    > 我々も手を出せない

    そんなことはないようです。
    Microsoft Research でサマーインターンを経験した方のブログには
    次のように書かれています。
    http://www.smalltown.ne.jp/~usata/diary/?date=20080218#p03
    > 根本的には(まだ準備が整っていないのに)完全に統計的な手法に
    > スイッチしてしまったのが今回の問題の原因であると思っている。
    http://www.smalltown.ne.jp/~usata/diary/?date=20080217#c02
    > MS-IME の開発は中国主体ですが、日本の人も関わっているし、
    > シアトルの MSR の(日本人の)研究者も関わっていますよ。

    ということで、かな漢字変換モデルを変更したことが
    精度低下の原因のようです。
    (一部しか抜粋していないのでリンク先をご覧ください)

    統計的手法によるかな漢字変換では、
    1. 文章を数GB以上集める
       Google が大規模日本語データを公開しています。
       http://googlejapan.blogspot.com/2007/11/n-gram.html
    2. どの性質の単語がどの性質の単語と結びつきやすいかを
       算出して辞書を作る
    こうしてできた辞書を基にかな漢字変換を行います。

    この方式のいいところは、
    ・辞書を手作業で編集する必要がない
    ・日本語に限らずどの言語でも同じ方式でシステムを構築することができる
    (大量の文章と単語切り分けシステムがあれば辞書を構築できる)
    ということです。

    先に記した usata さんは、この手法を利用したかな漢字変換システムを
    テスト公開されています (ChaIME [チャイム] といいます)。
    http://cl.naist.jp/~mamoru-k/chaime/index.html
    仕組みについてはこちらで詳しく述べられています。
    http://cl.naist.jp/~mamoru-k/chaime/statime.html

    誤変換についてですが、
    単語がどのように結びつくかを基にして変換するので、
    単語を1語入力するだけでは適切な変換結果を得にくいと思います。
    ある程度まとまった文章を入力することが必要です。

    ところで、
    > 中国にシフトしまっていて我々も手を出せない
    という表現がひとり歩きして騒ぎになっていたようです。
    政治と絡めてそういうのを叩きたい人が多い世の中なのかもしれません。
    > 中国にシフトしまっていて我々も手を出せない に一致する日本語のページ 約 11,800 件

    Apr. 11
    Picture of Anonymous
    型金 wrote:
    たしかバカな変換だ。しかし、どうも中国にシフトにしたくせにしか読み取れない
    ニュアンスに断然反対。なぜならば、こちら側にきちんと仕様はあいまいがなく
    ださなきゃいけない。それからテストもきちんとやるべし。会長さんの発言は社会
    影響がおおきくて個人感情をまたないでほしい!
    Apr. 4
    No namewrote:
    香港に渡航→「香港にと甲」
    にと甲ってなんでしょうか?
    無脂肪乳→「無脂肪入」
    無脂肪入ってます!って何が入ってるんでしょう?(とタイプしたら入って増すと変換しました。)
     
    Mar. 2
    Picture of Anonymous
    pitagora wrote:
    MS IME2007があまりに使えず、かつ皆様も同様と知りATOKに変えました。
    非常に快適。。。というか普通に変換してくれます。

    昔、PC98時代の一太郎+ATOKを思い起こさせるのが、なんだかなぁと感じます。

    Feb. 20
    No namewrote:
    昨日ちょうどVISTAで誤変換に遭遇したところでした。それは「深呼吸」が「新呼吸」。誤変換というよりそのような単語が登録されてないみたいですね。XPではちゃんと変換できますので明らかに退化です。昔はIMEでもそれほど誤変換で苦痛を覚えたことはなかったのですが、VISTAになってから違和感がつきまとっています。本当にATOKに変えようかと思っているところです。
    Feb. 19
    Picture of Anonymous
    (名前なし) wrote:
    自分の名前にはJIS第二水準の文字が含まれるのですが、MS-IMEがこれまで変換できたことは一度もありません。
    NEC AIかな漢字やATOK、OAK、MKK(松下かな漢字変換)、OASYS、RUPO、文豪では変換できていたので、そのころにはなかった問題なのですがWindows95が普及したころから自分の名前を同音異体で表記したメールや郵便物が届くようになりました。
    またWindows以降のPCユーザは相手の名前を間違えるのは大変失礼なことだという認識がない方が少なからずいらっしゃいまして、字を間違えていると指摘しても「IMEが変換しないから」などと開き直られたりします。こういうことを言う人は一人二人じゃありません。変換できなきゃひらがなで入れればいいのに、なぜ違う字を入力するのでしょうか。しまいには私が神経質すぎると言われる始末です。
    話が逸れました。そういうわけで正直、MS-IMEには大変迷惑しています。
    最近のバージョンでは人名辞書にチェックを入れれば変換できますが、デフォルトでは外れてます。
    自分の入力する漢字なら気をつければいいですが、自分の名前は他人が入力することもあるので、IMEがバカなのは本当に困るのです。デフォルトで人名を変換できるようにしてほしいですね。
    あと誤変換ですが「デフォルトで人命を変換」です。
    Feb. 19
    No namewrote:
    MS-IME も、昔はそれ程悪くなかったと思います。私は、一太郎を使うのをやめたときに、ATOK から MS-IME に乗り替えた口です。しかし、MS-IME 2002 ぐらいからでしょうか、明らかに学習機能がスカタンしているとしか思えなくなり、IME だけ、ATOK に戻しました。ストレスが全然ちがうんですよね。

    ATOK をデフォルトに指定していても、何かの拍子に MS-IME がしゃしゃり出てきてイライラするので、MS-IME は削除しています。で、今一番の不満はと言うと、せっかく削除した MS-IME を Microsoft Update が勝手に復活させる事です。
    Feb. 19
    石原裕次郎記念館はちゃんと変換されます。 ですが単語で「へんかん」と打つと「返還」が一語目に来てましたね。 あとパーツ館と打ちたい場合に「パーツ間」や「パーツ冠」となってしまい カタカナ+漢字の変換効率は低いと思います。 (ここでも返還効率と出ました) やたら返還が出るので、何かこだわってるのでしょうか・・・(´・ω・) あまりの変換効率の悪さにATOK2008を買いました・・・
    Feb. 19
    Hideki Saitowrote:
    いつも拝読しておりますが、あまりにも同感だったのでコメントさせていただきたいと思います。
    個人的にはATOKを常用していて、時々MS-IMEを試してみるのですが、言わば短すぎる鉛筆で文字を書いているような感覚に襲われます。
    IMEの変換効率が悪いのは大げさかもしれませんが、英語圏でいうとキーボードの文字が足りてないようなようなものだと思っています。特に表現活動の基礎となる部分である入力部分ですからその開発を軽視するようなのであれば、未来は無い、本当にその通りだと思います。
    Feb. 17
    kingfisherwrote:
    プロフィール表示にチェックしてもそもそもニックネームくらいしか入力していませんでした、すみません。 とりあえずこのコメント欄では(名前なし)で通します。 さらに、という風に表現されているところからも自動学習機能が一枚間で(勘で、噛んで・・・)そうな予感がしたのですが・・・。 セキュリティ制限の所為か否かは一端UACを無効した状態でメールとコメント欄に入力・変換した場合で差があるかどうかで簡単に確認できると思いますよ。(あまりほめられた方法ではないですが) といってから気付きましたが、MS IME2007は設定で学習機能を無効にすることもできるみたいですね。
    Feb. 16
    (名前なし様)、
     
    コメントありがとうございます。
    Office SP1は入れています。 Office SP1を入れないと死にますよ、とメッセージが出てOffice 2007が自爆した時に、画面に「Office SP1の更新をしてください、その場所はここをクリック」って書いてあるのだけど、Office のアップデートサイトではなく、Windows Updateに飛び込んで、そこでクリックするとOffice 2007の更新が始まるという、情けない仕様なのだけど....こんなところからも、MS社内でOffice 2007SP1への更新を一人でもちゃんとやってみて、"④ようかん"....どうやら、これが”使用感”の変換候補第1位らしい...もとい、使用感を開発の人と共有できていれば、SP1へのアップデートも増えるだろうし、SP1への更新の手間や手順のアホらしさを理解できるだろうに...「パソコンをシャットダウンしてホテルをチェックアウトしようとしたら、更新中は電気を切ってはダメって表示されたで、重たい荷物を3つも抱えながらパソコンの蓋を開けたままホテル内を移動してチェックアウトして、車に乗り込んだのでした」...アップデートをしたのちに、4時間ほど放っておいたのに自動的にシャットダウン再起動をせずに朝になってシャットダウンしてのがその理由なのだけれど...シャットダウンする前に更新作業を始めるから電源落としてはダメってのはどうにかならんのかね? せめて、次回に廻すとかのオプションが無いまま、SP1の更新ソフトを作成した人は...変じゃないの?
     
    今、MSで執行役員をしている人の何人が自分でマシンのセットアップやSP1への更新を自らやっているのだろうか?Windows Live Writerや、Live Space の不具合が何か月も改修されないことも、同根なのではないかと思う次第です。
     
    では、ふるかわでした
    Feb. 16
    iwagさま、
     
    中国にシフトしてという意味は、外部の協力会社に発注しているということではなく、中国の開発部門が作業の分担と責任を持っているということです。本件は、研究部門(Research)とは関係の無い話です。ポイントは、米国のResearch部門にも日本語言語解析の専門家が研究員で努めており、日本語の変換効率を高めるための開発努力をしてきた人間もたくさんいて、なおかつ操作性(ユーザビリティ)の向上やテスティング手順、お客様からのフィードバックが全て機能してMS IMEは使い物になる状態になってきたのではないか? それなのに、使い勝手も変換結果も後退しているように見えるのは何故?ということです。
     
    合わせて、楠さま、
    楠さんの指摘は当たっているけれど、ハズレでもあるのは..私はIEにおいてもユーザー辞書を参照できるようにいじっているはずで...銀行の口座番号や航空会社のマイレージ番号をユーザー辞書登録していたのが、IE下では使えないので、FirFoxを使ってアクセスしていた...それも、IEで辞書登録をすると[Windowsが認めた正規アプリではないので、ユーザー登録ができません」というお馬鹿のエラーが出るのに辟易して、パッチを当ててユーザー辞書が使えるようにしているのでありました。というわけで、IE環境とWindows のアプリで変換効率の結果が異なることは、ユーザー辞書の禁止と菅家ないと思われます。
     
    というよりも、IME本体の辞書の参照テーブルが異常終了して電源社団(遮断だってば...)、何度やっても電源社団ね..遮断した時に正しい組み合わせを生成することができずに...発狂するということにこそ問題があるのではないかと思っているのですが...いかがなもんでしょう?
     
    では、ふるかわでした
    Feb. 16
    Picture of Anonymous
    iwag wrote:
    中国にシフトしてしまって――というのは中国に外注しているんじゃなくて中国のラボで開発しているという意味ではないんでしょうか.
    Microsoft Research Asiaなんかは北京にあるマイクロソフトのラボですよね.
    ふと疑問に思っただけです.失礼しました.

    Feb. 16
    正憲 楠wrote:
    IEでは正しく変換されるとすると、やはりユーザー辞書の問題ですね。VistaのIEからIMEを使う場合は、セキュリティのためにIEを制限された権限で実行している関係で、ユーザー辞書を参照しないのです。
    Feb. 16
    kingfisherwrote:
    下の記事によると マイクロソフト、Office 2007/Vista SP1の概要を紹介 http://pc.watch.impress.co.jp/docs/2007/1207/ms.htm >「Vista上で走るアプリケーションは内容によって、実行時の保護レベルが異なる。具体的にはIEはより高いレベルの保護環境で実行している。 >このとき辞書学習データのようなデータベースを共有できないので、IEと他アプリケーションの学習データが異なる現象が発生する。これについてはOffice SP1で解決する予定」 だということなので、古川さんがOffice SP1を入れていなかったり、Office SP1でも修正されていなかったりするなら コメントを書く時(IEを使っているとき)とそうでないときで挙動が違うのは不思議ではなさそうです。 ・・・いやつまり学習データを利用しない時の方が(少なくとも古川さんの場合は)優秀ということになって、それはそれでどうなのよって気がしますが。。。
    Feb. 15
    kajimotowrote:
    私も不満に思っている一人です。
    私の環境では、「西」 が 「荷し」と変換されてしまいます。。
    Feb. 15

    Trackbacks (3)

    The trackback URL for this entry is:
    http://furukawablog.spaces.live.com/blog/cns!156823E649BD3714!9079.trak
    Weblogs that reference this entry