FMUSER Truyền video và âm thanh không dây dễ dàng hơn!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Người Afrikaans
sq.fmuser.org -> Tiếng Albania
ar.fmuser.org -> tiếng Ả Rập
hy.fmuser.org -> Armenia
az.fmuser.org -> Azerbaijan
eu.fmuser.org -> Basque
be.fmuser.org -> Tiếng Belarus
bg.fmuser.org -> Tiếng Bulgaria
ca.fmuser.org -> Catalan
zh-CN.fmuser.org -> Tiếng Trung (Giản thể)
zh-TW.fmuser.org -> Trung Quốc (truyền thống)
hr.fmuser.org -> Tiếng Croatia
cs.fmuser.org -> Tiếng Séc
da.fmuser.org -> Đan Mạch
nl.fmuser.org -> Hà Lan
et.fmuser.org -> Tiếng Estonia
tl.fmuser.org -> Phi Luật Tân
fi.fmuser.org -> Phần Lan
fr.fmuser.org -> Pháp
gl.fmuser.org -> Galicia
ka.fmuser.org -> tiếng Georgia
de.fmuser.org -> Đức
el.fmuser.org -> Hy Lạp
ht.fmuser.org -> Tiếng Creole của Haiti
iw.fmuser.org -> Tiếng Do Thái
hi.fmuser.org -> Tiếng Hindi
hu.fmuser.org -> Hungary
is.fmuser.org -> tiếng Iceland
id.fmuser.org -> tiếng Indonesia
ga.fmuser.org -> Ailen
it.fmuser.org -> Ý
ja.fmuser.org -> Nhật Bản
ko.fmuser.org -> Hàn Quốc
lv.fmuser.org -> Tiếng Latvia
lt.fmuser.org -> Tiếng Litva
mk.fmuser.org -> Người Macedonian
ms.fmuser.org -> Mã Lai
mt.fmuser.org -> Maltese
no.fmuser.org -> Na Uy
fa.fmuser.org -> tiếng Ba Tư
pl.fmuser.org -> Tiếng Ba Lan
pt.fmuser.org -> tiếng Bồ Đào Nha
ro.fmuser.org -> Rumani
ru.fmuser.org -> tiếng Nga
sr.fmuser.org -> Tiếng Serbia
sk.fmuser.org -> Tiếng Slovak
sl.fmuser.org -> Tiếng Slovenia
es.fmuser.org -> tiếng Tây Ban Nha
sw.fmuser.org -> Tiếng Swahili
sv.fmuser.org -> Thụy Điển
th.fmuser.org -> Thái
tr.fmuser.org -> Thổ Nhĩ Kỳ
uk.fmuser.org -> Tiếng Ukraina
ur.fmuser.org -> Tiếng Urdu
vi.fmuser.org -> Tiếng việt
cy.fmuser.org -> tiếng Wales
yi.fmuser.org -> Yiddish
(1) Thông tin dự phòng của tín hiệu video
Lấy định dạng thành phần YUV của việc ghi video kỹ thuật số làm ví dụ, YUV đại diện cho độ sáng và hai tín hiệu khác biệt màu sắc tương ứng. Ví dụ, đối với hệ thống TV pal hiện có, tần số lấy mẫu của tín hiệu độ chói là 13.5mhz; dải tần của tín hiệu sắc độ thường bằng một nửa hoặc nhỏ hơn tín hiệu độ sáng, là 6.75mhz hoặc 3.375mhz. Lấy tần số lấy mẫu 4: 2: 2 làm ví dụ, tín hiệu Y sử dụng 13.5mhz, tín hiệu sắc độ U và V được lấy mẫu bằng 6.75mhz và tín hiệu lấy mẫu được lượng tử hóa bằng 8bit, sau đó có thể tính được tốc độ mã của video kỹ thuật số như sau:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216Mbit / s
Nếu một lượng lớn dữ liệu như vậy được lưu trữ hoặc truyền trực tiếp, sẽ rất khó để sử dụng công nghệ nén để giảm tốc độ bit. Tín hiệu video kỹ thuật số có thể được nén theo hai điều kiện cơ bản:
L. dư thừa dữ liệu. Ví dụ, dư thừa không gian, dư thừa thời gian, dư thừa cấu trúc, dư thừa entropy thông tin, v.v., tức là có mối tương quan chặt chẽ giữa các pixel của hình ảnh. Loại bỏ những dư thừa này không dẫn đến mất thông tin, và đó là nén không mất dữ liệu.
L. dư thừa thị giác. Một số đặc điểm của mắt người, chẳng hạn như ngưỡng phân biệt độ sáng, ngưỡng thị giác, độ nhạy đối với độ sáng và sắc độ khác nhau, điều này khiến chúng ta không thể đưa ra các lỗi thích hợp trong mã hóa và sẽ không được phát hiện. Các đặc điểm thị giác của mắt người có thể được sử dụng để đổi lấy dữ liệu nén với độ méo khách quan nhất định. Nén này là mất mát.
Việc nén tín hiệu video kỹ thuật số dựa trên hai điều kiện trên, điều này làm cho dữ liệu video được nén rất nhiều, có lợi cho việc truyền tải và lưu trữ. Các phương pháp phổ biến của nén video kỹ thuật số là mã hóa hỗn hợp, nghĩa là kết hợp mã hóa biến đổi, ước tính chuyển động và bù chuyển động, và mã hóa entropy để nén mã hóa. Thông thường, mã hóa biến đổi được sử dụng để loại bỏ dư thừa trong khung của hình ảnh, ước tính chuyển động và bù chuyển động được sử dụng để loại bỏ dư thừa giữa các khung của hình ảnh và mã hóa entropy được sử dụng để cải thiện hơn nữa hiệu quả nén. Ba phương pháp mã hóa nén sau đây được giới thiệu ngắn gọn.
(a) Phương pháp mã hóa nén
(b) Chuyển đổi mã hóa
Chức năng của mã hóa biến đổi là biến đổi tín hiệu hình ảnh được mô tả trong miền không gian sang miền tần số, sau đó mã hóa các hệ số đã biến đổi. Nói chung, hình ảnh có mối tương quan chặt chẽ trong không gian, và sự chuyển đổi sang miền tần số có thể nhận ra mối tương quan giữa trang trí và sự tập trung năng lượng. Biến đổi trực giao thông thường bao gồm biến đổi Fourier rời rạc, biến đổi cosin rời rạc, v.v. Biến đổi cosin rời rạc được sử dụng rộng rãi trong nén video kỹ thuật số.
Biến đổi cosin rời rạc được gọi là biến đổi DCT. Nó có thể biến đổi khối ảnh của L * l từ miền không gian sang miền tần số. Do đó, trong quá trình nén và mã hóa ảnh dựa trên DCT, ảnh cần được chia thành các khối ảnh không chồng lên nhau. Giả sử kích thước của một hình ảnh là 1280 * 720, nó được chia thành các khối hình ảnh 160 * 90 với kích thước 8 * 8 không chồng lên nhau dưới dạng lưới. Sau đó, phép biến đổi DCT có thể được thực hiện cho từng khối ảnh.
Sau khi khối được chia, mỗi khối ảnh 8 * 8 điểm được gửi đến bộ mã hóa DCT, và khối ảnh 8 * 8 được chuyển từ miền không gian sang miền tần số. Hình bên dưới cho thấy một ví dụ về khối hình ảnh 8 * 8, trong đó số thể hiện giá trị độ sáng của mỗi pixel. Qua hình có thể thấy giá trị độ sáng của từng pixel trong khối ảnh này tương đối đồng đều, đặc biệt giá trị độ sáng của các pixel liền kề không lớn cho thấy tín hiệu hình ảnh có mối tương quan chặt chẽ.
Một khối hình ảnh 8 * 8 thực tế
Hình sau là kết quả của phép biến đổi DCT của khối ảnh trong hình trên. Qua hình vẽ có thể thấy rằng sau khi biến đổi DCT, hệ số tần số thấp ở góc trên bên trái tập trung rất nhiều năng lượng, trong khi năng lượng ở hệ số tần số cao ở góc dưới bên phải là rất nhỏ.
Các hệ số của khối ảnh sau khi biến đổi DCT
Tín hiệu cần được định lượng sau khi biến đổi DCT. Bởi vì mắt người nhạy cảm với các đặc tính tần số thấp của hình ảnh, chẳng hạn như độ sáng tổng thể của vật thể, chứ không phải các chi tiết tần số cao trong hình ảnh, vì vậy trong quá trình truyền, thông tin tần số cao có thể được truyền ít hơn hoặc không, chỉ phần tần số thấp. Quá trình lượng tử hóa làm giảm việc truyền thông tin bằng cách lượng tử hóa các hệ số của vùng tần số thấp và lượng tử hóa thô các hệ số trong vùng tần số cao, loại bỏ thông tin tần số cao không nhạy cảm với mắt người. Do đó, lượng tử hóa là một quá trình nén mất dữ liệu và là lý do chính gây ra sự phá hủy chất lượng trong mã hóa nén video.
Quá trình định lượng có thể được biểu thị bằng công thức sau:
Trong số đó, FQ (U, V) đại diện cho hệ số DCT sau khi lượng tử hóa; f (U, V) đại diện cho hệ số DCT trước khi lượng tử hóa; Q (U, V) đại diện cho ma trận trọng số lượng tử hóa; q là bước lượng tử hóa; vòng đề cập đến sự hợp nhất và giá trị đầu ra được coi là giá trị số nguyên gần nhất.
Chọn hệ số lượng tử hóa một cách hợp lý, và kết quả sau khi lượng tử hóa khối ảnh đã biến đổi như hình bên.
Hệ số DCT sau khi định lượng
Hầu hết các hệ số DCT được thay đổi thành 0 sau khi lượng tử hóa, trong khi chỉ có một số hệ số là giá trị khác XNUMX. Tại thời điểm này, chỉ những giá trị khác XNUMX mới cần được nén và mã hóa.
(b) Mã hóa entropy
Mã hóa Entropy được đặt tên vì độ dài mã trung bình sau khi mã hóa gần với giá trị entropy của nguồn. Mã hóa Entropy được thực hiện bởi VLC (mã hóa độ dài thay đổi). Nguyên tắc cơ bản là cấp mã ngắn cho biểu tượng có xác suất cao trong nguồn và cấp mã dài cho biểu tượng có xác suất xuất hiện nhỏ để thu được độ dài mã trung bình ngắn hơn về mặt thống kê. Mã hóa độ dài biến thường bao gồm mã Hoffman, mã số học, mã chạy,… Mã hóa độ dài đường chạy là một phương pháp nén rất đơn giản, hiệu suất nén không cao nhưng tốc độ mã hóa và giải mã nhanh nên vẫn được sử dụng rộng rãi, đặc biệt sau khi chuyển đổi mã hóa, sử dụng mã hóa chiều dài chạy, có hiệu quả tốt.
Đầu tiên, hệ số AC ngay sau hệ số DC đầu ra của bộ định lượng phải được quét theo kiểu Z (như thể hiện trong đường mũi tên). Z-scan chuyển hệ số lượng tử hóa hai chiều thành chuỗi một chiều, và sau đó tiếp tục mã hóa độ dài đường chạy. Cuối cùng, một mã có độ dài thay đổi khác được sử dụng để mã hóa dữ liệu sau khi mã hóa chạy, chẳng hạn như mã hóa Hoffman. Thông qua loại mã hóa độ dài thay đổi này, hiệu quả của mã hóa được cải thiện hơn nữa.
(c) Ước lượng chuyển động và bù chuyển động
Ước lượng chuyển động và bù chuyển động là những phương pháp hiệu quả để loại bỏ mối tương quan về hướng thời gian của các chuỗi hình ảnh. Các phương pháp biến đổi DCT, lượng tử hóa và mã hóa entropy được mô tả ở trên dựa trên một hình ảnh khung. Thông qua các phương pháp này, mối tương quan về không gian giữa các pixel trong hình ảnh có thể được loại bỏ. Thực tế, ngoài mối tương quan về không gian, tín hiệu hình ảnh còn có mối tương quan về mặt thời gian. Ví dụ, đối với video kỹ thuật số với nền tĩnh như đồng phát tin tức và chuyển động nhỏ của phần chính của hình ảnh, sự khác biệt giữa mỗi hình ảnh là rất nhỏ và mối tương quan giữa các hình ảnh là rất lớn. Trong trường hợp này, chúng tôi không cần mã hóa từng hình ảnh khung riêng biệt mà chỉ có thể mã hóa các phần đã thay đổi của các khung video liền kề, để giảm thêm lượng dữ liệu. Công việc này được thực hiện bằng cách ước lượng chuyển động và bù chuyển động.
Công nghệ ước tính chuyển động thường chia hình ảnh đầu vào hiện tại thành nhiều khối hình ảnh nhỏ không chồng lên nhau, ví dụ: kích thước của hình ảnh khung là 1280 * 720. Đầu tiên, nó được chia thành các khối hình ảnh 40 * 45 với 16 * 16 kích thước không chồng lên nhau ở dạng lưới và sau đó, trong phạm vi cửa sổ tìm kiếm của hình ảnh trước hoặc hình ảnh sau, hãy tìm một khối cho mỗi khối hình ảnh để tìm một khối hình ảnh trong phạm vi của cửa sổ tìm kiếm Khối hình ảnh giống nhất. Quá trình tìm kiếm được gọi là ước lượng chuyển động. Bằng cách tính toán thông tin vị trí giữa khối ảnh giống nhau nhất và khối ảnh, ta có thể thu được một vectơ chuyển động. Bằng cách này, khối ảnh hiện tại có thể được trừ khỏi khối ảnh tương tự nhất được trỏ bởi vectơ chuyển động của ảnh tham chiếu và có thể thu được khối ảnh dư. Bởi vì mỗi giá trị pixel trong khối ảnh dư là rất nhỏ, tỷ lệ nén cao hơn có thể đạt được trong mã hóa nén. Quá trình trừ này được gọi là bù chuyển động.
Bởi vì hình ảnh tham chiếu cần thiết được sử dụng để ước tính chuyển động và bù chuyển động trong quá trình mã hóa, nên việc chọn hình ảnh tham chiếu là rất quan trọng. Nói chung, bộ mã hóa chia mỗi đầu vào hình ảnh khung thành ba loại khác nhau theo các hình ảnh tham chiếu khác nhau: khung I (trong), khung B (dự đoán hướng dẫn) và khung P (dự đoán). Như trong hình.
Trình tự cấu trúc khung I, B, P điển hình
Như trong hình, I frame chỉ sử dụng dữ liệu trong frame để mã hóa và nó không cần ước lượng chuyển động và bù chuyển động trong quá trình mã hóa. Rõ ràng, vì khung hình I không loại bỏ mối tương quan của hướng thời gian, tỷ lệ nén tương đối thấp. Trong quá trình mã hóa, khung P sử dụng khung I phía trước hoặc khung P làm hình ảnh tham chiếu để bù chuyển động, trên thực tế, nó mã hóa sự khác biệt giữa hình ảnh hiện tại và hình ảnh tham chiếu. Chế độ mã hóa của khung B tương tự như khung P, chỉ khác là nó cần sử dụng khung I trước hoặc khung P và khung I hoặc khung P sau để dự đoán trong quá trình mã hóa. Do đó, mỗi mã hóa khung P cần sử dụng một hình ảnh trong khung làm hình ảnh tham chiếu, trong khi khung B cần hai khung làm tham chiếu. Ngược lại, khung B có tỷ lệ nén cao hơn khung P.
(d) Mã hóa hỗn hợp
Bài báo giới thiệu một số phương pháp quan trọng trong nén và mã hóa video. Trong ứng dụng thực tế, các phương pháp này không tách rời nhau, và chúng thường được kết hợp với nhau để đạt được hiệu quả nén tốt nhất. Hình dưới đây cho thấy mô hình của mã hóa lai (tức là mã hóa biến đổi + ước lượng chuyển động và bù chuyển động + mã hóa entropy). Mô hình này được sử dụng rộng rãi trong các tiêu chuẩn MPEG1, MPEG2, H.264 và các tiêu chuẩn khác. Từ hình vẽ, chúng ta có thể thấy rằng hình ảnh đầu vào hiện tại phải được chia thành các khối trước tiên, khối của hình ảnh thu được bởi khối sẽ được trừ khỏi khối dự đoán hình ảnh sau khi bù chuyển động để thu được hình ảnh khác biệt x, sau đó chuyển đổi và lượng tử hóa DCT được thực hiện cho khối hình ảnh khác biệt. Dữ liệu đầu ra được lượng tử hóa có hai nơi khác nhau: một là gửi đến bộ mã hóa entropy để mã hóa, hai là dòng mã được mã hóa được xuất ra một bộ nhớ đệm Lưu trong thiết bị và chờ truyền. Một ứng dụng khác là đếm ngược định lượng và đảo ngược thay đổi đối với tín hiệu x ', bổ sung đầu ra khối hình ảnh với bù chuyển động để thu được tín hiệu hình ảnh dự đoán mới và gửi một khối hình ảnh dự đoán mới đến bộ nhớ khung.
|
Nhập email để nhận bất ngờ
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Người Afrikaans
sq.fmuser.org -> Tiếng Albania
ar.fmuser.org -> tiếng Ả Rập
hy.fmuser.org -> Armenia
az.fmuser.org -> Azerbaijan
eu.fmuser.org -> Basque
be.fmuser.org -> Tiếng Belarus
bg.fmuser.org -> Tiếng Bulgaria
ca.fmuser.org -> Catalan
zh-CN.fmuser.org -> Tiếng Trung (Giản thể)
zh-TW.fmuser.org -> Trung Quốc (truyền thống)
hr.fmuser.org -> Tiếng Croatia
cs.fmuser.org -> Tiếng Séc
da.fmuser.org -> Đan Mạch
nl.fmuser.org -> Hà Lan
et.fmuser.org -> Tiếng Estonia
tl.fmuser.org -> Phi Luật Tân
fi.fmuser.org -> Phần Lan
fr.fmuser.org -> Pháp
gl.fmuser.org -> Galicia
ka.fmuser.org -> tiếng Georgia
de.fmuser.org -> Đức
el.fmuser.org -> Hy Lạp
ht.fmuser.org -> Tiếng Creole của Haiti
iw.fmuser.org -> Tiếng Do Thái
hi.fmuser.org -> Tiếng Hindi
hu.fmuser.org -> Hungary
is.fmuser.org -> tiếng Iceland
id.fmuser.org -> tiếng Indonesia
ga.fmuser.org -> Ailen
it.fmuser.org -> Ý
ja.fmuser.org -> Nhật Bản
ko.fmuser.org -> Hàn Quốc
lv.fmuser.org -> Tiếng Latvia
lt.fmuser.org -> Tiếng Litva
mk.fmuser.org -> Người Macedonian
ms.fmuser.org -> Mã Lai
mt.fmuser.org -> Maltese
no.fmuser.org -> Na Uy
fa.fmuser.org -> tiếng Ba Tư
pl.fmuser.org -> Tiếng Ba Lan
pt.fmuser.org -> tiếng Bồ Đào Nha
ro.fmuser.org -> Rumani
ru.fmuser.org -> tiếng Nga
sr.fmuser.org -> Tiếng Serbia
sk.fmuser.org -> Tiếng Slovak
sl.fmuser.org -> Tiếng Slovenia
es.fmuser.org -> tiếng Tây Ban Nha
sw.fmuser.org -> Tiếng Swahili
sv.fmuser.org -> Thụy Điển
th.fmuser.org -> Thái
tr.fmuser.org -> Thổ Nhĩ Kỳ
uk.fmuser.org -> Tiếng Ukraina
ur.fmuser.org -> Tiếng Urdu
vi.fmuser.org -> Tiếng việt
cy.fmuser.org -> tiếng Wales
yi.fmuser.org -> Yiddish
FMUSER Truyền video và âm thanh không dây dễ dàng hơn!
Liên hệ
Địa Chỉ:
Phòng số 305 Tòa nhà HuiLan Số 273 đường Huanpu Quảng Châu Trung Quốc 510620
Categories
Đăng ký bản tin