お分かりでしょうか。
この手の肌感覚は重要です。自称専門家は、頭でっがちで、テクノロジに対してありもしない幻想を抱いていることがあります。
例を挙げましょう。
Bill Gates and Ken Caldeira Discuss Wind Power
Energy sources that provide power without producing CO2 are critical to addressing the challenge of global warming. The book Sustainable Energy – without the hot air prompted Bill to ask climate researcher Ken Caldeira what the prospects are for generating power from wind in the upper atmosphere.
Google翻訳の結果。
CO2を生成せずに電力を供給するエネルギー源は、地球温暖化の課題に取り組むために重要です。本持続可能なエネルギー – 熱風なしで見通しが上層大気の風から電力を生成するために何であるか気候研究者ケンカルデイラを求める法案を促した。
彼ら(ニポジン)は、翻訳結果を見て、
前半はいいけど、後半はイミフ。
メリケンって、この程度の日本語しか書けないの?
という感想を持ちます。したりカオのITボーイが、
いやいや、これはGoogleが機械翻訳したものだから。
とフォローしてもだめなんです。
メリケンのGoogleが翻訳しているんだったら、
おんなじことじゃねぇか。ちがうのかよっ!
仮にあなたがITエキスパートだとして、Google翻訳の内部処理を適切に説明することができるでしょうか。そもそもGoogle翻訳の内部処理について詳しく語られている資料があるでしょうか。
上記リンク先の子供だましの動画と文章を見れば分かることですが、
Google翻訳は
人間が翻訳した文書からパターンを得ている
だそうです。
ということは、先に挙げた、
前半はいいけど、後半はイミフ。
メリケンって、この程度の日本語しか書けないの?
という指摘も当たらずとも甘からずうまからず(byダチョウ)ではないでしょうか。
FAQもチェックしてみましょう。
現在市場に出回っている自動翻訳システムのほとんどはルール ベースで開発されており、語彙や文法の定義など多くの作業を必要とします。
一方で、Google の翻訳システムの手法では、ターゲットとなる言語で記述された単一言語のテキストと、人間が翻訳した他言語のサンプル翻訳テキストを対にしたものを大量にコンピュータに入力します。そしてこれらのテキストに統計的学習手法を適用して、翻訳モデルを構築しています。Google のリサーチ評価では、この手法が優れた結果をもたらすことが判明しています。
Yahoo翻訳と比較してみましょう。
Yahoo翻訳結果:
CO2を生産することなく力を提供するエネルギー源は、地球温暖化の挑戦について述べることにきわめて重大です。本持続可能なエネルギー – 見通しが高層大気で風から力を発生させるために何であるかについて、気候研究者ケンCaldeiraに尋ねる熱気促されたビルなしで。
太字部分は大して変わらない品質のように見えますがね。
いずれにしても人間様がまともな訳文を導出できなければ、機械もできません。その根本の部分にはこの数十年、大した進歩が無いように見えます。
機械学習の専門家は、それがソフトウェアの一分野のように鼻にかけますが、源泉は異なります。
機械学習の源泉は、倣い加工機械です。
ごみため的には、機械学習の発生と発展は、
倣い加工機械(ex倣い旋盤、倣い塗装)
→→→→統計的機械学習
というナガレです。人間の動作を真似させるという原理はメカが先なのです。
機械は人間様の真似をしているだけなのですから、
まともな翻訳和文が出力されないのは、
メリケンの日本語力(リョク)が足りない
(または日本人の翻訳者の力不足)
と考えても差し支えないのです。
単なる猿真似を演じさせるための子供だまし手法を探すことを、さも高度な研究のように騙る詐欺師は多いですから、だまされないように注意しましょう。
ほとんどは、海外の研究成果、それもロシア人スパム業者の成果を日本語向けに翻訳して応用しているだけのような連中ですから、いかにもタチが悪い。