動画のリップシンク

画像と音声がずれてます。

とても気になります。

ニュース映像などでは致命的で、見る気をそがれます。

歌唱ものも最悪です。

MADもタイミングがずれていて白けます。ノイズだらけのVHSテープのほうが良いです。

Flashプレイヤがわるいのかと思っていたのですが、iTunesで配信されるポッドキャストでもズレズレです。

世に出回る動画オーサリングソフトがマヌケなのか、もしかしたらうちのPCのサウンドドライバがマヌケなのか。確認する気もおこりません。

それを指摘する人が少ないのも気になります。もしかしてYoutubeにアップした時点でずれるのでしょうか?

たとえばNHKの10年以上前の解説では、CCDカメラが撮像管にくらべていかにマヌケな特性をもっているかについて明確に示してくれています。

最近CMOSにシフトしつつある民生用カメラ素子ですが、こういうアプリケーションレベルで気になる特性については誰も解説してくれません。コスト競争力がどうのこうの、とか、色再現性がどうのこうのとかいうようなどうでもいい話ばかりです。

マヌケな人たちは、

高度に圧縮された動画を再生するにはそれなりにCPUパワーが必要で、遅延はしようがない。

などと真顔でおっしゃります。

よくわからないのですが、動画圧縮フォーマットでは、画像と音声を完全非同期で記録しているんですか?

また、動画を再生できるということは平均単位時間あたりのCPUパワーは足りているという認識なのですが、ここでおっしゃる遅延とは、何から基準の遅延なのでしょうか?

あるいは、こんな立ち話も聞きました。

音声が早いんだよ。音声の処理は軽いからね。そんなものはバッファをかませて遅延させればいいだけのこと。プレイヤ側でなんとかすりゃいいじゃん。

WindowsMediaPlayerやiTunes7にはそんな機能は見当たりません。

自前でプレイヤを作ったらできるんでしょうか?

遅延処理というのは、大変重い処理です。FIFOをかますだけだから実装は簡単というのは、パフォーマンスについて考えなしの人の与太話に過ぎません。無駄なFIFOが一段あるだけで本来必要なバス帯域に対して2倍の帯域を占有することになります。

そもそも音声が遅い場合はどうしたらいいんでしょうか。最近ではワイヤレスヘッドホンなどで酷い性能のものが市販されているように見受けられます。BlueTooth?画像を遅延させるバッファってどうやって作るんです?

手元のメディアプレイヤで音声のグラフィックイコライザ機能を有効にすると遅延が大きくなる気がするのですが、フィルタ処理で遅延が生じるのは常識ではないのでしょうか。

MPEG-4あたりの圧縮フォーマットでは当然これらの事情をすべて考慮されていると思い込んでいるのですが、どなたかご存知ないでしょうか。

圧縮フォーマットと、圧縮ファイルフォーマットは違うとか、どうでもいい話は、どうでもいいので。

りんくる

ごみため(ー日ー膳!) 高品位サウンド