FMUSER Truyền video và âm thanh không dây dễ dàng hơn!

[email được bảo vệ] WhatsApp + 8618078869184
Ngôn ngữ

    Sự khác biệt, mã hóa và ứng dụng của MPEG-4 và H264

     

     MPEG4 là một công nghệ nén phù hợp để giám sát
     
      MPEG4 được công bố vào tháng 1998 năm 4. Tiêu chuẩn quốc tế MPEG1999, ban đầu dự kiến ​​được đưa vào sử dụng vào tháng 4 năm 4, không chỉ để mã hóa video và âm thanh ở một tốc độ bit nhất định, mà còn chú ý nhiều hơn đến tính tương tác và tính linh hoạt của hệ thống đa phương tiện. Các chuyên gia của nhóm chuyên gia MPEG đang làm việc chăm chỉ để tạo ra MPEG-4800. Chuẩn MPEG-64000 chủ yếu được sử dụng trong Điện thoại Video, Email Video và Tin tức Điện tử, vv Yêu cầu tốc độ truyền của nó tương đối thấp, trong khoảng 4800-64000bits / giây và độ phân giải trong khoảng 176-144bits / giây. Nó là 4XXNUMX. MPEG-XNUMX sử dụng băng thông rất hẹp, nén và truyền dữ liệu thông qua công nghệ tái tạo khung hình, nhằm thu được ít dữ liệu nhất và có được chất lượng hình ảnh tốt nhất.


     
       So với MPEG-1 và MPEG-2, đặc điểm của MPEG-4 là nó phù hợp hơn với các dịch vụ AV tương tác và giám sát từ xa. MPEG-4 là tiêu chuẩn hình ảnh động đầu tiên thay đổi bạn từ thụ động sang chủ động (không còn chỉ xem, cho phép bạn tham gia, nghĩa là tương tác); một đặc điểm khác của nó là tính toàn diện; từ nguồn, MPEG-4 cố gắng pha trộn các đối tượng tự nhiên với các đối tượng nhân tạo (theo nghĩa hiệu ứng hình ảnh). Mục tiêu thiết kế của MPEG-4 cũng có khả năng thích ứng và khả năng mở rộng rộng hơn. MPEG4 cố gắng đạt được hai mục tiêu:

       1. Truyền thông đa phương tiện theo tốc độ bit thấp;
      2. Nó là sự tổng hợp của truyền thông đa phương tiện trong nhiều ngành công nghiệp.

     

      Theo mục tiêu này, MPEG4 giới thiệu các đối tượng AV (Audio / Visaul Objects), giúp thực hiện nhiều hoạt động tương tác hơn. Độ phân giải chất lượng video của MPEG-4 tương đối cao và tốc độ dữ liệu tương đối thấp. Lý do chính là MPEG-4 áp dụng công nghệ ACE (Advanced Decoding Efficiency), đây là một tập hợp các quy tắc thuật toán mã hóa được sử dụng trong MPEG-4 lần đầu tiên. Định hướng mục tiêu liên quan đến ACE có thể cho phép tốc độ dữ liệu rất thấp. So với MPEG-2, nó có thể tiết kiệm 90% không gian lưu trữ. MPEG-4 cũng có thể được nâng cấp rộng rãi trong các luồng âm thanh và video. Khi video thay đổi từ 5kb / s đến 10Mb / s, tín hiệu âm thanh có thể được xử lý trong khoảng từ 2kb / s đến 24kb / s. Điều đặc biệt quan trọng cần nhấn mạnh là tiêu chuẩn MPEG-4 là một phương pháp nén hướng đối tượng. Nó không chỉ đơn giản là chia hình ảnh thành một số khối như MPEG-1 và MPEG-2, mà theo nội dung của hình ảnh, các đối tượng (đối tượng, ký tự, nền) Nó được tách ra để thực hiện mã hóa nội khung và liên khung. và nén, đồng thời cho phép phân bổ linh hoạt tốc độ mã giữa các đối tượng khác nhau. Nhiều byte hơn được phân bổ cho các đối tượng quan trọng và ít byte hơn được phân bổ cho các đối tượng thứ cấp. Do đó, tỷ lệ nén được cải thiện đáng kể để có thể thu được kết quả tốt hơn với tốc độ mã thấp hơn. Phương pháp nén hướng đối tượng của MPEG-4 cũng làm cho chức năng phát hiện hình ảnh và độ chính xác được phản ánh nhiều hơn. Chức năng phát hiện hình ảnh cho phép hệ thống ghi video ổ cứng có chức năng cảnh báo chuyển động video tốt hơn.


     
    Tóm lại, MPEG-4 là một tiêu chuẩn mã hóa video hoàn toàn mới với tốc độ bit thấp và tỷ lệ nén cao. Tốc độ truyền là 4.8 ~ 64kbit / s và nó chiếm một không gian lưu trữ tương đối nhỏ. Ví dụ: đối với màn hình màu có độ phân giải 352 × 288, Khi không gian chiếm dụng của mỗi khung hình là 1.3KB, nếu bạn chọn 25 khung hình / giây, nó sẽ yêu cầu 120KB mỗi giờ, 10 giờ mỗi ngày, 30 ngày mỗi tháng và 36GB mỗi kênh mỗi tháng. Nếu là 8 kênh thì cần 288GB, điều này rõ ràng có thể chấp nhận được.

     

       Có nhiều loại công nghệ trong lĩnh vực này, nhưng cơ bản nhất và được sử dụng rộng rãi nhất đồng thời là MPEG1, MPEG2, MPEG4 và các công nghệ khác. MPEG1 là công nghệ có tỷ lệ nén cao nhưng chất lượng hình ảnh kém hơn; trong khi công nghệ MPEG2 chủ yếu tập trung vào chất lượng hình ảnh, tỷ lệ nén nhỏ nên cần không gian lưu trữ lớn; Công nghệ MPEG4 là một công nghệ phổ biến hơn hiện nay, sử dụng công nghệ này có thể tiết kiệm không gian, chất lượng hình ảnh cao và không yêu cầu băng thông truyền mạng cao. Ngược lại, công nghệ MPEG4 tương đối phổ biến ở Trung Quốc và cũng đã được các chuyên gia trong ngành công nhận.


     
      Theo giới thiệu, vì tiêu chuẩn MPEG4 sử dụng đường dây điện thoại làm phương tiện truyền dẫn, các bộ giải mã có thể được cấu hình tại chỗ theo các yêu cầu khác nhau của ứng dụng. Sự khác biệt giữa nó và phương pháp mã hóa nén dựa trên phần cứng chuyên dụng là hệ thống mã hóa mở và các mô-đun thuật toán mới và hiệu quả có thể được thêm vào bất kỳ lúc nào. MPEG4 điều chỉnh phương pháp nén theo đặc điểm không gian và thời gian của hình ảnh, để có được tỷ lệ nén lớn hơn, dòng mã nén thấp hơn và chất lượng hình ảnh tốt hơn MPEG1. Mục tiêu ứng dụng của nó là truyền băng tần hẹp, nén chất lượng cao, hoạt động tương tác và biểu thức tích hợp các đối tượng tự nhiên với các đối tượng nhân tạo, đồng thời đặc biệt nhấn mạnh đến khả năng thích ứng và khả năng mở rộng rộng. Do đó, MPEG4 dựa trên các đặc điểm của mô tả cảnh và thiết kế hướng băng thông, điều này làm cho nó rất phù hợp với lĩnh vực giám sát video, chủ yếu thể hiện ở các khía cạnh sau:


      1. Dung lượng lưu trữ được tiết kiệm - dung lượng cần thiết để sử dụng MPEG4 bằng 1/10 dung lượng của MPEG1 hoặc M-JPEG. Ngoài ra, do MPEG4 có thể tự động điều chỉnh phương pháp nén tùy theo sự thay đổi của cảnh, nên nó có thể đảm bảo rằng chất lượng hình ảnh sẽ không bị suy giảm đối với ảnh tĩnh, cảnh thể thao nói chung và cảnh hoạt động cường độ cao. Đó là một phương pháp mã hóa video hiệu quả hơn.

      2. Chất lượng hình ảnh cao - Độ phân giải hình ảnh cao nhất của MPEG4 là 720x576, gần với hiệu ứng hình ảnh của DVD. MPEG4 dựa trên chế độ nén AV xác định rằng nó có thể đảm bảo độ nét tốt cho các đối tượng chuyển động và thời gian / thời gian / chất lượng hình ảnh có thể điều chỉnh được.

            3. Yêu cầu về băng thông đường truyền mạng không cao - do tỷ lệ nén của MPEG4 gấp hơn 10 lần MPEG1 và M-JPEG cùng chất lượng, băng thông chiếm dụng trong quá trình truyền mạng chỉ bằng khoảng 1/10. MPEG1 và M-JPEG có cùng chất lượng. . Theo yêu cầu chất lượng hình ảnh tương tự, MPEG4 chỉ cần băng thông hẹp hơn.

    ====================
    Điểm nổi bật về kỹ thuật của Tiêu chuẩn mã hóa video mới H.264

      Tóm tắt:

      Đối với các ứng dụng thực tế, khuyến nghị H.264 do hai tổ chức tiêu chuẩn hóa quốc tế lớn là ISO / IEC và ITU-T cùng xây dựng là một bước phát triển mới trong công nghệ mã hóa video. Nó có các tính năng độc đáo trong ước tính chuyển động đa chế độ, biến đổi số nguyên, mã hóa ký hiệu VLC thống nhất và cú pháp mã hóa phân lớp. Do đó, thuật toán H.264 có hiệu quả mã hóa cao và triển vọng ứng dụng của nó nên được hiển thị rõ ràng.
     

     

       Từ khóa: mã hóa video giao tiếp hình ảnh JVT

       Kể từ những năm 1980, sự ra đời của hai loạt tiêu chuẩn mã hóa video quốc tế chính, MPEG-x được xây dựng bởi ISO / IEC và H.26x do ITU-T xây dựng, đã mở ra một kỷ nguyên mới của các ứng dụng lưu trữ và truyền thông video. Từ các đề xuất mã hóa video H.261 đến H.262 / 3, MPEG-1/2/4, v.v., có một mục tiêu chung luôn được theo đuổi, đó là thu được càng nhiều càng tốt với tốc độ bit thấp nhất có thể (hoặc dung lượng lưu trữ). Chất lượng hình ảnh tốt. Hơn nữa, khi nhu cầu truyền tải hình ảnh của thị trường tăng lên, vấn đề làm thế nào để thích ứng với đặc điểm truyền dẫn của các kênh khác nhau ngày càng trở nên rõ ràng. Đây là vấn đề cần được giải quyết bằng tiêu chuẩn video mới H.264 do IEO / IEC và ITU-T cùng phát triển.

     
       H.261 là gợi ý mã hóa video sớm nhất, mục đích là tiêu chuẩn hóa công nghệ mã hóa video trong các ứng dụng truyền hình và điện thoại video hội nghị mạng ISDN. Thuật toán mà nó sử dụng kết hợp phương pháp mã hóa kết hợp dự đoán giữa các khung có thể giảm dư thừa theo thời gian và biến đổi DCT có thể giảm dư thừa không gian. Nó khớp với kênh ISDN và tốc độ mã đầu ra của nó là p × 64kbit / s. Khi giá trị của p nhỏ, chỉ có thể truyền hình ảnh có độ nét thấp, thích hợp cho các cuộc gọi TV trực tiếp; khi giá trị của p lớn (chẳng hạn như p> 6), có thể truyền hình ảnh TV hội nghị với độ nét tốt hơn. H.263 đề xuất một tiêu chuẩn nén hình ảnh tốc độ bit thấp, về mặt kỹ thuật, đây là sự cải tiến và mở rộng của H.261, đồng thời hỗ trợ các ứng dụng có tốc độ bit nhỏ hơn 64kbit / s. Nhưng trên thực tế H.263 và sau này là H.263 + và H.263 ++ đã được phát triển để hỗ trợ các ứng dụng tốc độ bit đầy đủ. Có thể thấy thực tế là nó hỗ trợ nhiều định dạng hình ảnh, chẳng hạn như Sub-QCIF, QCIF, CIF, 4CIF và thậm chí 16CIF và các định dạng khác.

     

      Tốc độ mã của tiêu chuẩn MPEG-1 là khoảng 1.2Mbit / s và nó có thể cung cấp 30 khung hình ảnh chất lượng CIF (352 × 288). Nó được pha chế để lưu trữ video và phát lại đĩa CD-ROM. Thuật toán cơ bản của phần mã hóa video tiêu chuẩn MPEG-l tương tự như H.261 / H.263 và các biện pháp như dự đoán liên khung có bù chuyển động, DCT hai chiều và mã hóa thời lượng chạy VLC cũng được áp dụng. Ngoài ra, các khái niệm như khung trong (I), khung dự đoán (P), khung dự đoán hai chiều (B) và khung DC (D) được giới thiệu để nâng cao hơn nữa hiệu quả mã hóa. Trên nền tảng của MPEG-1, tiêu chuẩn MPEG-2 đã có một số cải tiến trong việc cải thiện độ phân giải hình ảnh và khả năng tương thích với TV kỹ thuật số. Ví dụ, độ chính xác của vectơ chuyển động của nó là một nửa pixel; trong các hoạt động mã hóa (chẳng hạn như ước tính chuyển động và DCT) Phân biệt giữa "khung" và "trường"; giới thiệu các công nghệ khả năng mở rộng mã hóa, chẳng hạn như khả năng mở rộng không gian, khả năng mở rộng theo thời gian và khả năng mở rộng tỷ lệ tín hiệu trên nhiễu. Tiêu chuẩn MPEG-4 được giới thiệu trong những năm gần đây đã giới thiệu mã hóa dựa trên các đối tượng nghe nhìn (AVO: Audio-Visual Object), giúp cải thiện đáng kể khả năng tương tác và hiệu quả mã hóa của truyền thông video. MPEG-4 cũng áp dụng một số công nghệ mới, chẳng hạn như mã hóa hình dạng, DCT thích ứng, mã hóa đối tượng video hình dạng tùy ý, v.v. Nhưng bộ mã hóa video cơ bản của MPEG-4 vẫn thuộc loại bộ mã hóa lai tương tự như H.263.

     

       Tóm lại, khuyến nghị H.261 là một mã hóa video cổ điển, H.263 là sự phát triển của nó và sẽ dần thay thế nó trong thực tế, chủ yếu được sử dụng trong truyền thông, nhưng vô số tùy chọn của H.263 thường khiến người dùng lúng túng. Loạt tiêu chuẩn MPEG đã phát triển từ các ứng dụng cho phương tiện lưu trữ đến các ứng dụng thích ứng với phương tiện truyền dẫn. Khung cơ bản của mã hóa video cốt lõi của nó phù hợp với H.261. Trong số đó, phần "mã hóa dựa trên đối tượng" bắt mắt của MPEG-4 là do vẫn còn những trở ngại kỹ thuật và khó có thể áp dụng rộng rãi. Do đó, đề xuất mã hóa video mới H.264 được phát triển trên cơ sở này đã khắc phục những điểm yếu của cả hai, giới thiệu một phương pháp mã hóa mới trong khuôn khổ mã hóa lai, cải thiện hiệu quả mã hóa và ứng dụng vào thực tế. Đồng thời, nó đã được hai tổ chức tiêu chuẩn hóa quốc tế lớn cùng xây dựng và triển vọng ứng dụng của nó sẽ được hiển nhiên.

     

    1. H.264 của JVT
    H.264 là một tiêu chuẩn mã hóa video kỹ thuật số mới được phát triển bởi nhóm video chung (JVT: nhóm video chung) của VCEG (Nhóm chuyên gia mã hóa video) của ITU-T và MPEG (Nhóm chuyên gia mã hóa hình ảnh chuyển động) của ISO / IEC. Nó là một phần 10 của H.264 của ITU-T và MPEG-4 của ISO / IEC. Việc trưng cầu bản thảo bắt đầu vào tháng 1998 năm 1999. Bản thảo đầu tiên được hoàn thành vào tháng 8 năm 2001. Mẫu thử nghiệm TML-264 được phát triển vào tháng 5 năm 2002. Ban FCD của H.XNUMX đã được thông qua tại cuộc họp lần thứ XNUMX của JVT vào tháng XNUMX năm XNUMX. Tiêu chuẩn hiện đang được phát triển và dự kiến ​​sẽ được chính thức áp dụng vào nửa đầu năm sau.

     

      H.264, giống như tiêu chuẩn trước, cũng là một chế độ mã hóa hỗn hợp của DPCM cộng với mã hóa biến đổi. Tuy nhiên, nó áp dụng một thiết kế ngắn gọn "trở về những điều cơ bản", không có nhiều tùy chọn và có được hiệu suất nén tốt hơn nhiều so với H.263 ++; nó tăng cường khả năng thích ứng với các kênh khác nhau và áp dụng cấu trúc và cú pháp "thân thiện với mạng". Có khả năng xử lý lỗi và mất gói tin; một loạt các mục tiêu ứng dụng để đáp ứng các nhu cầu về tốc độ khác nhau, độ phân giải khác nhau và các dịp truyền tải (lưu trữ) khác nhau; hệ thống cơ bản của nó là mở và không cần bản quyền để sử dụng.

     

    Về mặt kỹ thuật, có nhiều điểm nổi bật trong tiêu chuẩn H.264, chẳng hạn như mã hóa ký hiệu VLC thống nhất, ước tính độ dịch chuyển đa chế độ, độ chính xác cao, biến đổi số nguyên dựa trên khối 4 × 4 và cú pháp mã hóa phân lớp. Các biện pháp này làm cho thuật toán H.264 có hiệu suất mã hóa rất cao, dưới cùng chất lượng hình ảnh được tái tạo, nó có thể tiết kiệm khoảng 50% tỷ lệ mã so với H.263. Cấu trúc dòng mã của H.264 có khả năng thích ứng mạng mạnh mẽ, tăng khả năng khôi phục lỗi và có thể thích ứng tốt với ứng dụng của mạng IP và mạng không dây.

     

    2. Đặc điểm kỹ thuật của H264

     

      Thiết kế phân lớp
    Thuật toán H.264 có thể được chia thành hai lớp theo khái niệm: lớp mã hóa video (VCL: Video Coding Layer) chịu trách nhiệm trình bày nội dung video hiệu quả và lớp trừu tượng mạng (NAL: Network Abstraction Layer) chịu trách nhiệm về cách thức phù hợp yêu cầu của mạng. Đóng gói và truyền dữ liệu. Cấu trúc phân cấp của bộ mã hóa H.264 được thể hiện trong Hình 1. Một giao diện dựa trên gói được xác định giữa VCL và NAL, và việc đóng gói và báo hiệu tương ứng là một phần của NAL. Bằng cách này, VCL và NAL sẽ hoàn thành các nhiệm vụ về hiệu quả mã hóa cao và tính thân thiện với mạng.


      Lớp VCL bao gồm mã hóa lai bù chuyển động dựa trên khối và một số tính năng mới. Giống như các tiêu chuẩn mã hóa video trước đây, H.264 không bao gồm các chức năng như xử lý trước và xử lý sau trong bản nháp, điều này có thể làm tăng tính linh hoạt của tiêu chuẩn.


      NAL chịu trách nhiệm sử dụng định dạng phân đoạn của mạng lớp dưới để đóng gói dữ liệu, bao gồm định khung, báo hiệu kênh logic, sử dụng thông tin thời gian hoặc tín hiệu kết thúc trình tự, v.v. Ví dụ: NAL hỗ trợ các định dạng truyền video trên các kênh chuyển mạch kênh, và hỗ trợ các định dạng truyền tải video trên Internet bằng RTP / UDP / IP. NAL bao gồm thông tin tiêu đề riêng, thông tin cấu trúc phân đoạn và thông tin tải thực tế, tức là dữ liệu VCL lớp trên. (Nếu sử dụng công nghệ phân đoạn dữ liệu, dữ liệu có thể bao gồm một số phần).


       Ước tính chuyển động đa chế độ, chính xác cao

       H.264 hỗ trợ vectơ chuyển động với độ chính xác 1/4 hoặc 1/8 pixel. Ở độ chính xác 1/4 pixel, bộ lọc 6 vòi có thể được sử dụng để giảm nhiễu tần số cao. Đối với vectơ chuyển động có độ chính xác 1/8 pixel, có thể sử dụng bộ lọc 8 chạm phức tạp hơn. Khi thực hiện ước tính chuyển động, bộ mã hóa cũng có thể chọn bộ lọc nội suy "nâng cao" để cải thiện hiệu quả của dự đoán

     

       Trong dự đoán chuyển động của H.264, một khối macro (MB) có thể được chia thành các khối con khác nhau theo Hình 2 để tạo thành 7 chế độ kích thước khối khác nhau. Sự phân chia chi tiết và linh hoạt đa chế độ này phù hợp hơn với hình dạng của các đối tượng chuyển động thực tế trong ảnh, cải thiện đáng kể

     

    Độ chính xác của ước tính chuyển động được cải thiện. Theo cách này, mỗi khối macro có thể chứa 1, 2, 4, 8 hoặc 16 vectơ chuyển động.

     

       Trong H.264, bộ mã hóa được phép sử dụng nhiều hơn một khung trước đó để ước tính chuyển động, đây được gọi là công nghệ tham chiếu đa khung. Ví dụ: nếu 2 hoặc 3 khung chỉ là khung tham chiếu được mã hóa, bộ mã hóa sẽ chọn khung dự đoán tốt hơn cho mỗi macroblock mục tiêu và chỉ ra cho mỗi macroblock khung nào được sử dụng để dự đoán.

     

      Phép biến đổi số nguyên khối 4 × 4

       H.264 tương tự như tiêu chuẩn trước đó, sử dụng mã hóa biến đổi dựa trên khối cho phần dư, nhưng biến đổi là một phép toán số nguyên thay vì một phép toán số thực và quy trình về cơ bản tương tự như của DCT. Ưu điểm của phương pháp này là cho phép cùng một phép biến đổi chính xác và biến đổi nghịch đảo trong bộ mã hóa và bộ giải mã, điều này tạo điều kiện thuận lợi cho việc sử dụng số học điểm cố định đơn giản. Nói cách khác, không có "lỗi biến đổi nghịch đảo" ở đây. Đơn vị biến đổi là khối 4 × 4, thay vì khối 8 × 8 thường được sử dụng trước đây. Khi kích thước của khối biến đổi được giảm xuống, việc phân chia đối tượng chuyển động sẽ chính xác hơn. Bằng cách này, không chỉ lượng tính toán biến đổi là tương đối nhỏ, mà còn giảm đáng kể sai số hội tụ ở rìa của đối tượng chuyển động. Để làm cho phương pháp chuyển đổi khối kích thước nhỏ không tạo ra sự khác biệt về thang độ xám giữa các khối trong vùng mịn lớn hơn trong hình ảnh, hệ số DC của 16 khối 4 × 4 của dữ liệu độ sáng macroblock trong khung hình (mỗi khối nhỏ Một , tổng cộng là 16) thực hiện chuyển đổi khối 4 × 4 thứ hai và thực hiện chuyển đổi khối 2 × 2 trên hệ số DC của 4 khối 4 × 4 dữ liệu sắc độ (một khối cho mỗi khối nhỏ, tổng cộng là 4 khối).

     

       Để cải thiện khả năng kiểm soát tốc độ của H.264, sự thay đổi của kích thước bước lượng tử hóa được kiểm soát ở mức khoảng 12.5% thay vì tăng liên tục. Việc chuẩn hóa biên độ hệ số biến đổi được xử lý trong quá trình lượng tử hóa nghịch đảo để giảm độ phức tạp tính toán. Để nhấn mạnh độ trung thực của màu sắc, kích thước bước lượng tử hóa nhỏ được áp dụng cho hệ số sắc độ.

     

       VLC hợp nhất

    Có hai phương pháp để mã hóa entropy trong H.264. Một là sử dụng VLC thống nhất (UVLC: Universal VLC) cho tất cả các ký hiệu được mã hóa, và hai là sử dụng mã số học nhị phân thích ứng với nội dung (CABAC: Context-Adaptive). Mã số học nhị phân). CABAC là một tùy chọn không bắt buộc, hiệu suất mã hóa của nó tốt hơn một chút so với UVLC, nhưng độ phức tạp tính toán cũng cao hơn. UVLC sử dụng một bộ từ mã có độ dài không giới hạn và cấu trúc thiết kế rất đều đặn, và các đối tượng khác nhau có thể được mã hóa bằng cùng một bảng mã. Phương pháp này dễ dàng tạo từ mã và bộ giải mã có thể dễ dàng xác định tiền tố của từ mã và UVLC có thể nhanh chóng lấy lại đồng bộ hóa khi xảy ra lỗi bit

     

       Ở đây, x0, x1, x2, ... là các bit INFO, và là 0 hoặc 1. Hình 4 liệt kê 9 từ mã đầu tiên. Ví dụ: từ số thứ 4 chứa INFO01. Thiết kế của từ mã này được tối ưu hóa để đồng bộ hóa lại nhanh chóng để tránh lỗi bit.

     

       nội bộ

      Trong các tiêu chuẩn sê-ri H.26x và sê-ri MPEG-x trước đây, các phương pháp dự đoán liên khung được sử dụng. Trong H.264, dự đoán trong khung khả dụng khi mã hóa hình ảnh Intra. Đối với mỗi khối 4 × 4 (ngoại trừ cách xử lý đặc biệt của khối cạnh), mỗi pixel có thể được dự đoán với tổng trọng số khác nhau của 17 pixel được mã hóa trước đó gần nhất (một số trọng số có thể bằng 0), tức là pixel này 17 pixel ở góc trên bên trái của khối. Rõ ràng, loại dự đoán trong khung này không phải là đúng lúc, mà là một thuật toán mã hóa dự đoán được thực hiện trong miền không gian, có thể loại bỏ dư thừa không gian giữa các khối liền kề và đạt được hiệu quả nén hơn.

    Trong hình vuông 4 × 4, a, b, ..., p là 16 pixel được dự đoán và A, B, ..., P là các pixel được mã hóa. Ví dụ: giá trị của điểm m có thể được dự đoán bằng công thức (J + 2K + L + 2) / 4 hoặc bằng công thức (A + B + C + D + I + J + K + L) / 8, và như thế. Theo các điểm tham chiếu dự đoán đã chọn, có 9 chế độ khác nhau cho độ sáng, nhưng chỉ có 1 chế độ để dự đoán độ sáng trong khung.

     

      Đối với môi trường IP và không dây

       Bản dự thảo H.264 chứa các công cụ loại bỏ lỗi để tạo điều kiện truyền video nén trong môi trường thường xuyên xảy ra lỗi và mất gói, chẳng hạn như độ mạnh của truyền trong các kênh di động hoặc kênh IP.

     

       Để chống lại lỗi truyền dẫn, đồng bộ hóa thời gian trong luồng video H.264 có thể được thực hiện bằng cách sử dụng làm mới hình ảnh trong khung và đồng bộ hóa không gian được hỗ trợ bởi mã hóa có cấu trúc lát cắt. Đồng thời, để tạo điều kiện cho việc đồng bộ hóa lại sau một lỗi bit, một điểm đồng bộ hóa nhất định cũng được cung cấp trong dữ liệu video của một hình ảnh. Ngoài ra, làm mới macroblock nội khung và nhiều macroblock tham chiếu cho phép bộ mã hóa không chỉ xem xét hiệu quả mã hóa mà còn xem xét các đặc điểm của kênh truyền khi xác định chế độ macroblock.

     

    Ngoài việc sử dụng sự thay đổi của kích thước bước lượng tử hóa để thích ứng với tốc độ mã kênh, trong H.264, phương pháp phân đoạn dữ liệu thường được sử dụng để đối phó với sự thay đổi của tốc độ mã kênh. Nói chung, khái niệm phân đoạn dữ liệu là tạo ra dữ liệu video với các mức độ ưu tiên khác nhau trong bộ mã hóa để hỗ trợ chất lượng dịch vụ QoS trong mạng. Ví dụ, một phương pháp phân vùng dữ liệu dựa trên cú pháp được áp dụng để chia dữ liệu của mỗi khung thành nhiều phần theo mức độ quan trọng của nó, điều này cho phép loại bỏ thông tin ít quan trọng hơn khi bộ đệm bị tràn. Phương pháp phân vùng dữ liệu theo thời gian tương tự cũng có thể được sử dụng, phương pháp này được thực hiện bằng cách sử dụng nhiều hệ quy chiếu trong khung P và B.

     

      Trong ứng dụng của giao tiếp không dây, chúng tôi có thể hỗ trợ những thay đổi tốc độ bit lớn của kênh không dây bằng cách thay đổi độ chính xác lượng tử hóa hoặc độ phân giải không gian / thời gian của mỗi khung hình. Tuy nhiên, trong trường hợp phát đa hướng, không thể yêu cầu bộ mã hóa đáp ứng với các tốc độ bit khác nhau. Do đó, không giống như phương pháp FGS (Khả năng mở rộng hạt mịn) được sử dụng trong MPEG-4 (với hiệu suất thấp hơn), H.264 sử dụng khung SP chuyển mạch dòng thay vì mã hóa phân cấp.

    ========================

     

    3. Hiệu suất TML-8

      TML-8 là chế độ thử nghiệm của H.264, sử dụng nó để so sánh và kiểm tra hiệu quả mã hóa video của H.264. PSNR được cung cấp bởi kết quả thử nghiệm đã cho thấy rõ ràng rằng so với hiệu suất của MPEG-4 (ASP: Advanced Simple Profile) và H.263 ++ (HLP: High Latency Profile), kết quả của H.264 có lợi thế rõ ràng. Như hình 5.

    PSNR của H.264 rõ ràng là tốt hơn của MPEG-4 (ASP) và H.263 ++ (HLP). Trong thử nghiệm so sánh 6 tốc độ, PSNR của H.264 cao hơn trung bình 2dB so với MPEG-4 (ASP). Nó cao hơn trung bình 3dB so với H.263 (HLP). 6 tốc độ kiểm tra và các điều kiện liên quan của chúng là: tốc độ 32 kbit / s, tốc độ khung hình 10f / s và định dạng QCIF; Tốc độ 64 kbit / s, tốc độ khung hình 15f / s và định dạng QCIF; Tốc độ 128kbit / s, Tốc độ khung hình 15f / s và định dạng CIF; Tốc độ 256kbit / s, tốc độ khung hình 15f / s và định dạng QCIF; Tốc độ 512 kbit / s, tốc độ khung hình 30f / s và định dạng CIF; Tốc độ 1024 kbit / s, tốc độ khung hình 30f / s và định dạng CIF.

     

    4. khó thực hiện

       Đối với mọi kỹ sư xem xét các ứng dụng thực tế, trong khi chú ý đến hiệu suất vượt trội của H.264, nó nhất định phải đo lường độ khó của việc triển khai nó. Nói chung, việc cải thiện hiệu suất H.264 có được với cái giá là sự phức tạp tăng lên. Tuy nhiên, với sự phát triển của công nghệ, sự gia tăng độ phức tạp này nằm trong phạm vi chấp nhận được của công nghệ hiện tại hoặc tương lai gần của chúng ta. Trên thực tế, xét đến hạn chế về độ phức tạp, H.264 đã không áp dụng một số thuật toán cải tiến đặc biệt tốn kém về mặt tính toán. Ví dụ, H.264 không sử dụng công nghệ bù chuyển động toàn cầu, được sử dụng trong MPEG-4 ASP. Tăng độ phức tạp mã hóa đáng kể.

     

       Cả H.264 và MPEG-4 đều bao gồm khung hình B và chính xác hơn vàbộ lọc nội suy chuyển động lex hơn MPEG-2, H.263 hoặc MPEG-4 SP (Cấu hình đơn giản). Để hoàn thành tốt hơn ước tính chuyển động, H.264 đã tăng đáng kể các loại kích thước khối thay đổi và số lượng hệ quy chiếu thay đổi.

     

       Yêu cầu RAM H.264 chủ yếu được sử dụng cho hình ảnh khung tham chiếu và hầu hết các video được mã hóa sử dụng 3 đến 5 khung hình tham chiếu. Nó không yêu cầu nhiều ROM hơn bộ mã hóa video thông thường, vì H.264 UVLC sử dụng bảng tra cứu có cấu trúc tốt cho tất cả các loại dữ liệu

    5. nhận xét kết luận

       H.264 có triển vọng ứng dụng rộng rãi, chẳng hạn như giao tiếp video thời gian thực, truyền video Internet, dịch vụ phát trực tuyến video, giao tiếp đa điểm trên các mạng không đồng nhất, lưu trữ video nén, cơ sở dữ liệu video, v.v.

     

    Các đặc tính kỹ thuật của các khuyến nghị H.264 có thể được tóm tắt thành ba khía cạnh. Một là tập trung vào tính thực tiễn, áp dụng công nghệ hoàn thiện, theo đuổi hiệu quả mã hóa cao hơn và cách diễn đạt ngắn gọn; hai là tập trung vào việc thích ứng với mạng di động và IP và áp dụng Công nghệ phân cấp, phân tách mã hóa và kênh một cách chính thức, về bản chất, có tính đến các đặc điểm của kênh nhiều hơn trong thuật toán bộ mã hóa nguồn; thứ ba là trong khuôn khổ cơ bản của bộ mã hóa lai, tất cả các thành phần quan trọng chính của nó đều được thực hiện. Các cải tiến chính, chẳng hạn như ước tính chuyển động đa chế độ, dự đoán trong khung, dự đoán đa khung, VLC thống nhất, chuyển đổi số nguyên hai chiều 4 × 4, v.v.

     

       Cho đến nay, H.264 vẫn chưa được hoàn thiện, nhưng vì tỷ lệ nén cao hơn và khả năng thích ứng kênh tốt hơn, nó sẽ ngày càng được sử dụng rộng rãi hơn trong lĩnh vực lưu trữ hoặc truyền thông video kỹ thuật số, và tiềm năng phát triển của nó là không giới hạn.

    Cuối cùng, cần phải lưu ý rằng hiệu suất vượt trội của H.264 không phải là không có, nhưng cái giá phải trả là sự gia tăng lớn về độ phức tạp tính toán. Theo ước tính, độ phức tạp tính toán của mã hóa xấp xỉ 263 lần H.2 và độ phức tạp giải mã Xấp xỉ 263 lần H.XNUMX.

    ===========================

     

    Hiểu đúng về các sản phẩm công nghệ H.264 và MPEG-4, đồng thời loại bỏ tuyên truyền sai lệch của nhà sản xuất

       Người ta thừa nhận rằng tiêu chuẩn codec video H.264 có một mức độ tiến bộ nhất định, nhưng nó không phải là tiêu chuẩn mã hóa video được ưa chuộng, đặc biệt là đối với sản phẩm giám sát, vì nó cũng có một số lỗi kỹ thuật.

       được bao gồm trong tiêu chuẩn MPEG-4 Phần 10 như là tiêu chuẩn codec video H.264, có nghĩa là nó chỉ được gắn vào phần thứ mười của MPEG-4. Nói cách khác, H.264 không vượt quá phạm vi của tiêu chuẩn MPEG-4. Do đó, việc chuẩn H.264 và chất lượng truyền tải video trên Internet cao hơn MPEG-4 là không chính xác. Việc chuyển đổi từ MPEG-4 sang H.264 thậm chí còn khó hiểu hơn. Trước tiên, chúng ta hãy hiểu đúng về sự phát triển của MPEG-4:

    1. MPEG-4 (SP) và MPEG-4 (ASP) là công nghệ sản phẩm đầu tiên của MPEG-4

      MPEG-4 (SP) và MPEG-4 (ASP) được đề xuất vào năm 1998. Công nghệ của nó đã phát triển cho đến nay, và thực sự có một số vấn đề. Do đó, các nhân viên kỹ thuật hiện tại của nhà nước có khả năng phát triển MPEG-4 đã không áp dụng công nghệ lạc hậu này trong các sản phẩm giám sát video hoặc hội nghị truyền hình MPEG-4. Việc so sánh giữa các sản phẩm H.264 (sản phẩm kỹ thuật sau năm 2005) và công nghệ MPEG-4 (SP) sơ khai được quảng bá trên Internet thực sự không phù hợp. So sánh hiệu suất của các sản phẩm CNTT năm 2005 và 2001 có thuyết phục được không? . Điều cần giải thích ở đây là đây là hành vi thổi phồng kỹ thuật của các nhà sản xuất.

     

    Mời các bạn xem so sánh công nghệ:

    Một số nhà sản xuất so sánh sai: Với cùng chất lượng hình ảnh được tái tạo, H.264 giảm tốc độ bit xuống 50% so với H.263 + và MPEG-4 (SP).

    Các dữ liệu này về cơ bản so sánh dữ liệu sản phẩm công nghệ mới H.264 với dữ liệu sản phẩm công nghệ đầu tiên của MPEG-4, điều này vô nghĩa và gây hiểu nhầm cho việc so sánh các sản phẩm công nghệ MPEG-4 hiện tại. Tại sao các sản phẩm H.264 không so sánh dữ liệu với các sản phẩm công nghệ MPEG-4 mới vào năm 2006? Sự phát triển của công nghệ mã hóa video H.264 quả thực rất nhanh, nhưng hiệu ứng video giải mã video của nó chỉ tương đương với hiệu ứng video của Windows Media Player 9.0 (WM9) của Microsoft. Ví dụ: hiện tại, công nghệ MPEG-4 được sử dụng bởi máy chủ video ổ cứng và thiết bị hội nghị truyền hình của Huayi đã đạt đến thông số kỹ thuật (WMV) trong công nghệ giải mã video và đồng bộ hóa âm thanh và video chưa đầy 0.15 giây (trong vòng 150 mili giây ). H.264 và Microsoft WM9 không thể khớp

     

    2. Công nghệ giải mã video MPEG-4 đang phát triển:

    Hiện tại, công nghệ giải mã video MPEG-4 đang phát triển nhanh chóng chứ không phải như các nhà sản xuất quảng cáo rầm rộ trên Internet. Ưu điểm của chuẩn hình ảnh H.264 hiện tại chỉ nằm ở khả năng nén và lưu trữ, dung lượng này nhỏ hơn 15-20% so với tập tin lưu trữ MPEG-4 của các sản phẩm Huayi hiện nay, tuy nhiên định dạng video của nó không phải là định dạng chuẩn. Lý do là H.264 không áp dụng định dạng lưu trữ được sử dụng quốc tế và các tệp video của nó không thể mở được bằng phần mềm của bên thứ ba được sử dụng quốc tế. Do đó, ở một số chính phủ và cơ quan trong nước, khi lựa chọn thiết bị, người ta quy định rõ rằng các tệp video phải được mở bằng phần mềm của bên thứ ba được quốc tế chấp nhận. Điều này thực sự quan trọng đối với việc giám sát sản phẩm. Đặc biệt khi xảy ra trộm cắp, cảnh sát cần thu thập bằng chứng, phân tích, v.v.

     

    Phiên bản nâng cấp của bộ giải mã video MPEG-4 là (WMV) và âm thanh sẽ khác nhau tùy theo công nghệ mã hóa và kinh nghiệm của từng nhà sản xuất. Các sản phẩm công nghệ mới MPEG-4 trưởng thành hiện nay từ năm 2005 đến năm 2006 đều cao hơn nhiều so với các sản phẩm công nghệ H.264 về hiệu suất.

     

    Về đường truyền: So với MPE mớiSản phẩm công nghệ G-4 H.264, có các khuyết điểm sau:

    1. Đồng bộ hóa âm thanh và video: Đồng bộ hóa âm thanh và video H.264 có một số vấn đề, chủ yếu là về độ trễ. Hiệu suất truyền của H.264 tương đương với Windows Media Player 9.0 (WM9) của Microsoft. Hiện tại, công nghệ MPEG-4 được máy chủ video mạng Huayi áp dụng đạt độ trễ dưới 0.15 giây (150 mili giây) trong lĩnh vực giám sát video và hội nghị truyền hình, vượt quá khả năng của các sản phẩm H.264;

    2. Hiệu quả truyền dẫn mạng: áp dụng H.2

     

     

     

     

    Liệt kê tất cả Câu hỏi

    Tên nick

    E-mail

    Câu hỏi

    sản phẩm khác của chúng tôi:

    Gói thiết bị đài FM chuyên nghiệp

     



     

    Giải pháp IPTV khách sạn

     


      Nhập email để nhận bất ngờ

      fmuser.org

      es.fmuser.org
      it.fmuser.org
      fr.fmuser.org
      de.fmuser.org
      af.fmuser.org -> Người Afrikaans
      sq.fmuser.org -> Tiếng Albania
      ar.fmuser.org -> tiếng Ả Rập
      hy.fmuser.org -> Armenia
      az.fmuser.org -> Azerbaijan
      eu.fmuser.org -> Basque
      be.fmuser.org -> Tiếng Belarus
      bg.fmuser.org -> Tiếng Bulgaria
      ca.fmuser.org -> Catalan
      zh-CN.fmuser.org -> Tiếng Trung (Giản thể)
      zh-TW.fmuser.org -> Trung Quốc (truyền thống)
      hr.fmuser.org -> Tiếng Croatia
      cs.fmuser.org -> Tiếng Séc
      da.fmuser.org -> Đan Mạch
      nl.fmuser.org -> Hà Lan
      et.fmuser.org -> Tiếng Estonia
      tl.fmuser.org -> Phi Luật Tân
      fi.fmuser.org -> Phần Lan
      fr.fmuser.org -> Pháp
      gl.fmuser.org -> Galicia
      ka.fmuser.org -> tiếng Georgia
      de.fmuser.org -> Đức
      el.fmuser.org -> Hy Lạp
      ht.fmuser.org -> Tiếng Creole của Haiti
      iw.fmuser.org -> Tiếng Do Thái
      hi.fmuser.org -> Tiếng Hindi
      hu.fmuser.org -> Hungary
      is.fmuser.org -> tiếng Iceland
      id.fmuser.org -> tiếng Indonesia
      ga.fmuser.org -> Ailen
      it.fmuser.org -> Ý
      ja.fmuser.org -> Nhật Bản
      ko.fmuser.org -> Hàn Quốc
      lv.fmuser.org -> Tiếng Latvia
      lt.fmuser.org -> Tiếng Litva
      mk.fmuser.org -> Người Macedonian
      ms.fmuser.org -> Mã Lai
      mt.fmuser.org -> Maltese
      no.fmuser.org -> Na Uy
      fa.fmuser.org -> tiếng Ba Tư
      pl.fmuser.org -> Tiếng Ba Lan
      pt.fmuser.org -> tiếng Bồ Đào Nha
      ro.fmuser.org -> Rumani
      ru.fmuser.org -> tiếng Nga
      sr.fmuser.org -> Tiếng Serbia
      sk.fmuser.org -> Tiếng Slovak
      sl.fmuser.org -> Tiếng Slovenia
      es.fmuser.org -> tiếng Tây Ban Nha
      sw.fmuser.org -> Tiếng Swahili
      sv.fmuser.org -> Thụy Điển
      th.fmuser.org -> Thái
      tr.fmuser.org -> Thổ Nhĩ Kỳ
      uk.fmuser.org -> Tiếng Ukraina
      ur.fmuser.org -> Tiếng Urdu
      vi.fmuser.org -> Tiếng việt
      cy.fmuser.org -> tiếng Wales
      yi.fmuser.org -> Yiddish

       
  •  

    FMUSER Truyền video và âm thanh không dây dễ dàng hơn!

  • Liên hệ

    Địa Chỉ:
    Phòng số 305 Tòa nhà HuiLan Số 273 đường Huanpu Quảng Châu Trung Quốc 510620

    E-mail:
    [email được bảo vệ]

    Điện thoại/WhatApps:
    +8618078869184

  • Categories

  • Đăng ký bản tin

    TÊN ĐẦU HOẶC ĐẦY ĐỦ

    E-mail

  • giải pháp paypal  Western UnionNgân hàng Trung Quốc
    E-mail:[email được bảo vệ]   WhatsApp: +8618078869184 Skype: sky198710021 Tro chuyện vơi tôi
    Copyright 2006-2020 Powered By www.fmuser.org

    Liên hệ