Hệ thống AI mới của Microsoft mô tả hình ảnh tốt hơn con người

Hệ thống AI mới của Microsoft mô tả hình ảnh tốt hơn con người

16-10-2020 Lượt xem: 1,016

Microsoft đã tạo ra một hệ thống AI có khả năng mô tả hình ảnh rất tốt, thậm chí nó có thể làm tốt hơn cả con người. Mô hình được đưa ra gần đây dường như cũng tốt hơn gấp đôi so với mô hình phụ đề hình ảnh của công ty mà nó đã sử dụng từ năm 2015.

Hơn nữa, Microsoft không chỉ tạo ra hệ thống AI hữu ích mà còn chia sẻ công khai nó như một phần của dịch vụ nhận thức Azure, điều này có nghĩa bất kỳ nhà phát triển nào cũng có thể sử dụng nó trong ứng dụng của họ.

Ứng dụng See AI dành cho những người khiếm thị và người mù của Microsoft đã ra mắt hệ thống AI mới. Theo đó, AI hỗ trợ người mù và người khiếm thị bằng cách thuật lại thế giới xung quanh họ, đây chỉ là một ví dụ rõ ràng về mức độ hữu ích và quan trọng của hệ thống AI mới này. Hệ thống cũng sẽ có sẵn trong PowerPoint cho web, Windows và Mac để hỗ trợ cho các bài thuyết trình của bạn tạo nên các trải nghiệm thú vị hơn.

AI mới của Microsoft có thể phác họa hình ảnh theo yêu cầu

AI mới của Microsoft có thể phác họa hình ảnh theo yêu cầu

Phó Chủ tịch Microsoft Azure của Microsoft, Eric Boyd đã trả lời trong một cuộc phỏng vấn với tờ Engadget rằng: “Nó không chỉ thể hiện sự hiểu biết về các đối tượng trong một quang cảnh mà còn thể hiện cách chúng tương tác và mô tả lại chúng”.

Giờ đây, người khiếm thị và người mù có thể điều hướng Internet và thế giới xung quanh một cách dễ dàng hơn nhiều.

Và, điều thực sự nổi bật về công việc của Microsoft là nó được cung cấp ra thế giới bên ngoài nhanh như thế nào. 

Xuedong Huang, chuyên gia công nghệ của Microsoft về ngôn ngữ và dịch thuật đóng một vai trò quan trọng trong công việc này vì ông hiểu công nghệ này có thể tích hợp như thế nào đối với nhiều người.

Nhóm làm việc của Huang đã đào tạo mô hình AI bằng các hình ảnh có thẻ từ cụ thể, cung cấp ngôn ngữ hình ảnh cho hệ thống. Theo tuyên bố của ông trong một bài đăng trên blog của Microsoft thì: “Việc đào tạo trước từ vựng trực quan này về cơ bản là sự giáo dục cần thiết để đào tạo hệ thống, chúng tôi đang cố gắng đào tạo trí nhớ vận động này”.

 

 

Bài viết liên quan


0913.111111

Chỉ đường

Chat FB

Chat Zalo

0913.111111