Dịch máy là gì?

dich-may-la-gi
Khái niệm về dịch máy

Dịch máy (hay còn gọi là dịch tự động) là một phần không thể thiếu của ngành dịch thuật và bản địa hóa ngày nay khi các công ty tiếp tục cố gắng mở rộng quy mô, tự động hóa và hợp lý hóa sản lượng bản dịch. Nhưng chính xác thì dịch máy là gì và nó hoạt động như thế nào? Làm thế nào chúng ta có thể kiểm soát chất lượng bản dịch và những người dịch tham gia vào quá trình nào?

Dịch máy hoạt động như thế nào?

dich-may-hoat-dong-nhu-nao
Dịch máy hoạt động như thế nào?

Dịch máy, nói một cách đơn giản, là việc sử dụng phần mềm để dịch – từ văn bản hoặc giọng nói – từ ngôn ngữ này sang ngôn ngữ khác. Bằng cách sử dụng các thuật toán, mẫu và mô hình ngôn ngữ lấy từ cơ sở dữ liệu lớn của các bản dịch hiện có, nó có thể đề xuất bản dịch cho các chuyên gia ngôn ngữ hoặc trong một số trường hợp, tự động dịch số lượng lớn văn bản mà không cần sự tham gia của con người. Đối với ngữ cảnh, các yếu tố phần mềm nằm trong danh mục chủ đề (ví dụ: y tế, pháp lý, khoa học), những nguồn thông tin trên mạng và bảng chú giải thuật ngữ .

Có nhiều kiểu dịch máy khác nhau với các mức độ phức tạp khác nhau, một số học hỏi và cải thiện không ngừng theo thời gian. Điều đó nói lên rằng, các nhà ngôn ngữ học vẫn rất cần trong quá trình kiểm soát chất lượng và bản địa hóa cho các đối tượng mục tiêu cụ thể.

Bạn cũng có thể đã đọc bản dịch có sự hỗ trợ của máy tính, bản dịch có sự hỗ trợ của con người và bản dịch tương tác. Chúng không giống như Dịch máy, mỗi công cụ đều có các đặc điểm và bộ công cụ riêng biệt.

Các loại dịch máy phổ biến nhất hiện nay

cac-loai-dich-may-pho-bien-hien-nay
Các loại dịch máy phổ biến hiện nay

Con người đã bắt đầu nghiên cứu công nghệ dịch máy kể từ những năm 1940, với mỗi công nghệ mới sẽ cải tiến quy trình tăng dần theo thời gian. Và, trong 5 năm qua, các công nghệ mới nổi, như  Trí tuệ nhân tạo và học chuyên sâu, cũng đã được tích hợp rất nhiều vào hoạt động bên trong của nó.

Có ba loại dịch máy đó chính là:

1- Dịch máy thống kê (SMT).

2- Dịch máy dựa trên quy tắc.

3- Dịch máy nơ-ron.

Dịch máy dựa trên quy tắc (RbMT)

quy-tac-dich-may-rbmt
Quy tắc dịch máy RBMT

Dịch máy dựa trên quy tắc RbMT là phần mềm dịch máy đầu tiên được sử dụng rộng rãi và vẫn được sử dụng cho đến ngày nay, là một hệ thống dựa trên quy tắc – do đó có tên  – nhờ vào một số lượng gần như vô hạn các thuật toán dựa trên ngữ pháp, cú pháp và cụm từ của ngôn ngữ.

Dịch máy thống kê (SMT)

Dịch máy thống kê là một phương pháp đã được phát triển mạnh mẽ trong thập kỷ qua, mặc dù nó được lên ý tưởng lần đầu tiên vào năm 1949. SMT sử dụng các mô hình ngôn ngữ thống kê với các tham số dựa trên các nguồn ngôn ngữ được tạo thành từ các bộ văn bản lớn, có cấu trúc. Mặc dù nó sử dụng hiệu quả các nguồn nhân lực và dữ liệu, các bản dịch thường hời hợt, giống như các bản dịch không trôi chảy sử dụng Google Dịch. Nó cũng không hoạt động tốt với các cặp ngôn ngữ có cú pháp khác nhau. Các nhà ngôn ngữ học cần phải giúp ra sức hỗ trợ.

Dịch máy nơ-ron (NMT)

Dịch máy nơ-ron (MT) là yếu tố liên quan nhất trong cả ba là dịch máy nơ-ron, được ra mắt lần đầu tiên vào năm 2016. NMT sử dụng mạng nơ-ron nhân tạo để dự đoán trình tự của các từ và liên tục cải thiện bản dịch bằng cách học hỏi từ nhiều nguồn, cơ sở dữ liệu, bảng chú giải thuật ngữ và các đề xuất dịch đã được người dịch phê duyệt. Phần mềm NMT thường chạy trên các đơn vị đồ họa của CPU để đáp ứng sức mạnh xử lý khổng lồ mà nó cần để hoạt động.

Nhiều công ty dịch vụ dịch thuật sử dụng NMT vì họ đã nhận ra rằng nó làm tăng năng suất dịch thuật và cắt giảm chi phí, đây là một lợi thế bán hàng B2B độc nhất. Các tổ chức sử dụng nó như Microsoft (bao gồm Skype, Bing, v.v.), Systran, Reverso và IBM.

Dịch máy hỗn hợp

Bản dịch máy hỗn hợp có nghĩa là hai trong số các loại được đề cập ở trên được sử dụng cùng một lúc. Các công ty sử dụng phương pháp này như một cách an toàn để cung cấp độ chính xác và đảm bảo quyền kiểm soát, thay vì dựa vào một giải pháp. Prompt, Systran và Omniscien Technologies là một số công ty sử dụng nó.

Vậy loại dịch máy nào tốt hơn?

loai-dich-may-nao-se-tot-hon
Loại dịch máy nào bạn nên sử dụng

Có những ưu và nhược điểm cho từng loại máy dịch RbMT tốt hơn về tính nhất quán và chất lượng có thể dự đoán được so với SMT, trong khi RbMT thể hiện sự trôi chảy nhiều hơn và có khả năng nắm bắt các quy tắc ngoại lệ. Tuy nhiên, giải pháp được tìm kiếm nhiều nhất hiện nay là phần mềm nơ-ron

Tìm hiểu thêm về hệ thống dịch máy

he-thong-dich-may-chuyen-nghiep
Hệ thống dịch máy chuyên nghiệp

Có ba loại hệ thống dịch máy có thể áp dụng cho bất kỳ công nghệ dịch máy nào:

Generic MThệ thống MT cơ bản nhất cung cấp các bản dịch tức thì với ít hoặc không cần tùy chỉnh, chẳng hạn như Google Dịch, Bing, Reverso và Yandex.

MT có thể tùy chỉnh sử dụng nền tảng của Generic MT, nhưng cho phép người dùng điều chỉnh thuật ngữ dựa trên ngữ cảnh, danh mục, phong cách, đối tượng mục tiêu, v.v.

Hệ thống thích ứng MT là hệ thống thường được sử dụng nhất trong các công cụ CAT. Nó cung cấp các đề xuất dịch trực tiếp cho các chuyên gia ngôn ngữ và học hỏi từ các lựa chọn được thực hiện theo thời gian để cải thiện những gì được đề xuất. Adaptive MT hoạt động cùng với bộ nhớ dịch và đã được chứng minh là một trong những công cụ hữu ích nhất cho người dịch, vì nó tăng tốc đáng kể công việc và đầu ra.

Công nghệ, công cụ và dịch vụ dịch máy

cong-nghe-dich-may-4.0
Công nghệ dịch máy thời kỳ 4.0

Dịch máy có tính khả dụng rộng rãi, chẳng hạn như trên đám mây, trên nền tảng, trên máy chủ hoặc thông qua tích hợp phần mềm với việc sử dụng API . Ví dụ: các dịch vụ dịch thuật của Google, Microsoft và Amazon bán API đám mây, trong khi các nhà phát triển khác như Systran và Prompt cung cấp MT có thể tùy chỉnh thông qua máy chủ hoặc sản phẩm máy tính để bàn. Tuy nhiên, các dịch giả chuyên nghiệp chủ yếu sử dụng MT ngay trong các công cụ CAT mà họ cần cho công việc của mình, như Trados, MemoQ, v.v.

Người dùng cũng có thể khai thác các tùy chọn dịch máy mã nguồn mở và độc lập . Chúng cho phép bất kỳ ai có hiểu biết về kỹ thuật xây dựng công cụ dịch máy của riêng họ. Để sử dụng bất kỳ bộ công cụ mã nguồn mở nào, bạn cần trang bị một bộ sưu tập lớn các văn bản song song bằng hai ngôn ngữ.

Chất lượng dịch máy

Phần mềm dịch máy, mặc dù rất hữu ích trong việc cải thiện năng suất của người dịch cũng như dịch khối lượng lớn văn bản, nhưng cũng phải tuân thủ các tiêu chuẩn chất lượng cao. Đây là lý do tại sao các chuyên gia ngôn ngữ được giao nhiệm vụ chỉnh sửa hậu kỳ của MT để đảm bảo kết quả là bản dịch tự nhiên phù hợp với ngữ cảnh, có cảm giác trò chuyện của con người và được bản địa hóa chính xác cho khán giả mục tiêu.

Chất lượng bản dịch cũng được đảm bảo về mặt kỹ thuật hơn. Các kỹ sư tính toán được giao nhiệm vụ xem xét các động cơ MT với các thử nghiệm và thử nghiệm A / B trên cơ sở liên tục. Một số bài kiểm tra, chẳng hạn như bài kiểm tra tự động BLEU (Đánh giá song ngữ), ROUGE, NIST và METEOR kiểm tra tỉ mỉ sự giống nhau giữa bản dịch của máy và người của cùng một văn bản.

Một mối quan tâm khác bên cạnh chất lượng là bảo mật. Do nhiều nền tảng dịch máy được chia sẻ nên các bản dịch không phải lúc nào cũng được giữ bí mật. Nhiều công ty ngăn chặn điều này bằng cách thiết lập một công cụ dịch máy tại chỗ chạy bên trong mạng công ty không cho phép quyền truy cập bên ngoài. Mặt khác, các giải pháp đám mây sử dụng mã hóa dữ liệu. Đó là lý do tại sao các công ty nên tránh các tùy chọn mở cho công chúng, đó là những cánh cổng dễ dàng cho tin tặc.

Công Nghệ Dịch Máy Có Tốt Hay Không?

dich-may-co-tot-hay-khong
Công nghệ dịch máy có tốt hay không

Công nghệ dịch máy là một lĩnh vực liên ngành thú vị kết hợp công nghệ, ngôn ngữ học và bản địa hóa mới nhất. Nhu cầu ngày càng tăng về bản địa hóa nội dung sẽ tiếp tục thúc đẩy những tiến bộ công nghệ trong MT với tốc độ ngày càng nhanh. Các chuyên gia ngôn ngữ phải tìm ra những cách hiệu quả để kiểm soát chất lượng và sự tiếp xúc của con người đối với các bản dịch máy.

Dịch máy tốt hay không tùy vào người sử dụng có biết cách vận hành để tối ưu hóa thời gian và đem lại bản dịch chất lượng nhất. Nếu bạn chỉ biết cách làm mà không tích lũy các kiến thức từ vựng thì bạn sẽ dần dần trở thành một “cỗ máy” làm lặp đi lặp lại hàng ngày.