Microsoft: Dữ liệu đám mây sẽ được lưu trữ trong DNA và hologram

Microsoft: Dữ liệu đám mây sẽ được lưu trữ trong DNA và hologram

20-10-2020 Lượt xem: 1,059

Dữ liệu đang phát triển với tốc độ chóng mặt, khiến các công nghệ hiện tại khó lòng bắt kịp. Đó là lý do Microsoft lao vào nghiên cứu công nghệ lưu trữ mới nhằm “bảo quản” một lượng dữ liệu khổng lồ trong DNA và hologram. Những công nghệ lưu trữ này có thể phá vỡ các trung tâm dữ liệu trên thế giới, và Microsoft cho biết chúng gần gũi hơn chúng ta nghĩ.

Tại Hội nghị Ignite gần đây, Giám đốc kỹ thuật của Microsoft Azure - Mark Russinovich – đã giới thiệu mẫu thử hoạt động cho hệ thống lưu trữ dữ liệu dựa trên DNA và phép chụp ảnh giao thoa laze. Những cách tiếp cận này đòi hỏi sự can thiệp kỹ thuật rộng rãi để có thể thương mại hóa trên quy mô lớn, nhưng Russinovich cho biết tốc độ tăng trưởng dữ liệu ở thế giới thực đã tạo ra cơ hội xuất hiện thích hợp cho những công nghệ mới ấy.

“Lượng dữ liệu được tạo ra đang thực sự vượt khỏi tầm kiểm soát của chúng ta. Có một số loại dữ liệu không thể lưu trữ một cách hiệu quả bằng các công nghệ hiện có. Đây chính là lúc mà chúng tôi phải khám phá ra cách thức mới để lưu trữ dữ liệu hiệu quả và có tầm ảnh hưởng trên quy mô lớn để thu hẹp khoảng cách này”, Russinovich phân tích. 

Các tác động về mặt cơ sở hạ tầng kỹ thuật số rất sâu sắc. Russinovich cho biết việc lưu trữ một exabyte dữ liệu hiện tại đòi hỏi 2 trung tâm dữ liệu Azure, một trung tâm có kích thước tương đương Walmart. Bộ lưu trữ DNA có thể chứa được exabyte đó chỉ trong một cm khối không gian.

“Nó là hữu cơ, bền vững và bền bỉ. Nó kéo dài suốt hàng trăm hàng nghìn cho đến hàng triệu năm. Trên Trái đất, chúng ta từng tìm thấy DNA 700.000 năm tuổi. Chỉ cần bảo quản trong điều kiện thích hợp, nó có thể tồn tại mãi mãi”, Russinovich khẳng định.

Khái niệm lưu trữ holographic (ảnh 3 chiều) không còn là điều mới lạ, nhưng vẫn rất khó để tiến hành trên thực tế. Russinovich lý giải: “Nó được phát minh vào thập niên 1960, nhưng chưa bao giờ thành công về mặt thương mại hóa. Chúng tôi thực sự tin rằng đây là thời điểm thích hợp để tận dụng công nghệ lưu trữ siêu ngầu này. Chúng tôi cũng tin rằng Microsoft đang đứng ở vị trí thuận lợi để có thể làm điều đó, bởi chúng tôi đã nghiên cứu công nghệ quang học trong lĩnh vực này nhiều năm trên HoloLens, và chúng tôi có thể tận dụng những công nghệ quang học ấy cho lưu trữ ảnh 3 chiều”.

Những cách tiếp cận mới cho việc lưu trữ này có vẻ giống khoa học viễn tưởng. Một điều rõ ràng là Microsoft sẵn sàng đầu tư nguồn lực đáng kể vào nghiên cứu “moonshot” nhằm mang lại sự thay đổi cho cơ sở hạ tầng – như những gì đã thấy rõ ở dự án Natick – sáng kiến vận hành các trung tâm dữ liệu dưới đáy biển.

Thăm dò lưu trữ DNA

Trong các hệ thống lưu trữ dữ liệu truyền thống, thông tin được lưu trữ trong một chuỗi nhị phân gồm các số 1 và 0, được ghi vào đĩa quay hoặc băng bằng cách dùng từ tính, hoặc vào đĩa DVD, Blu-Ray bằng tia laser. Ở hệ thống DNA, dữ liệu được lưu trữ trong một dung dịch lỏng có chứa DNA và được "đọc" bằng cách sử dụng các hệ thống kết hợp thành phần điện tử và phân tử.

Sáng kiến lưu trữ DNA của Microsoft áp dụng DNA nhân tạo do các công ty như Twist Bioscience tạo ra, thay vì lấy DNA từ người hoặc động vật.

Lưu trữ DNA.

Lưu trữ DNA.

“Bạn có thể hỏi ‘vậy khi tôi lưu trữ qua DNA những bức ảnh gia đình hoặc những bức ảnh của tôi từ kỳ nghỉ cuối cùng, loại sinh vật nào có thể được tạo ra?”, Russinovich nói. "May mắn thay, những thứ này sẽ bị trơ và không thực sự lớn lên, vì vậy đừng lo lắng về việc những sinh vật kỳ lạ bước ra từ những bức ảnh chụp trong kỳ nghỉ của bạn, đi xung quanh và tấn công mọi người."

Microsoft đã làm việc với các nhà nghiên cứu từ trường Đại học Washington để lập ra một hệ thống mã hóa dữ liệu trong DNA nhân tạo, được lưu trữ trong dung dịch lỏng, có thể được “đọc” và sử dụng trong xử lý dữ liệu.

Hệ thống lưu trữ dữ liệu DNA tự động sử dụng phần mềm chuyển đổi các số 1 và 0 của dữ liệu kỹ thuật số sang các khối xây dựng của DNA, được biểu thị dưới dạng chuỗi của As, Ts, Cs và Gs. Sau đó, nó sử dụng thiết bị phòng thí nghiệm để đưa các dung dịch và hóa chất cần thiết vào một bộ tổng hợp tạo ra các đoạn DNA đã sản xuất và đẩy chúng vào một bình lưu trữ.

Khi hệ thống cần lấy thông tin, nó sẽ bổ sung những hóa chất khác để chuẩn bị DNA và sử dụng máy bơm vi lỏng để đẩy dung dịch vào một hệ thống có thể “đọc” các chuỗi DNA, rồi chuyển đổi nó thành thông tin mà máy tính có thể hiểu được.

Đó là sự thú vị của khoa học. Nhưng trên thực tế, làm việc với DNA và các giải pháp là ý tưởng dành cho các phòng thí nghiệm, không phải cho các phương tiện lưu trữ dữ liệu.

“Quá trình này cho đến nay vô cùng thủ công. Theo nghĩa đen, mọi người sẽ di chuyển xung quanh với những chiếc ống đo nhỏ giọt trên tay. Cách duy nhất mà chúng tôi áp dụng để nâng quy mô lưu trữ DNA, giúp nó trở nên hữu ích và trở thành xu hướng chủ đạo là tự động hóa nó. Những gì chúng tôi đã làm cho thấy tính khả thi của việc tự động hóa toàn bộ quá trình – từ từng bit đến phân tử và quay lại từng bit”, Luiz Ceze – Giáo sư tại Phòng thí nghiệm Hệ thống Thông tin Phân tử thuộc trường đại học Washington nói.

Còn Russinovich nói trong bài diễn thuyết của anh tại Insight: “Chúng tôi đã thực sự đi đến mức có được một hệ thống lưu trữ DNA hoàn toàn tự động đầu tiên. Nó không chỉ là một bằng chứng về khái niệm. Chúng tôi sẽ lấy dữ liệu nhị phân và tổng hợp phân tử DNA. Chúng tôi đã có bộ phận lưu trữ và chuẩn bị lọ DNA bên trong đó, sau đó chúng tôi có thể tách ra theo trình tự và lấy dữ liệu kết quả tất cả trong một thử nghiệm”.

This is the first prototype of an automated system to store data within DNA, developed by researchers from Microsoft and the University of Washington

Mẫu thử đầu tiên của hệ thống tự động lưu trữ dữ liệu trong DNA, được phát triển bởi các nhà nghiên cứu từ Microsoft và đại học Washington. 

“Mục tiêu cuối cùng của chúng tôi là đưa một hệ thống vào quy trình sản xuất, tới người dùng cuối, tương tự với nhiều dịch vụ lưu trữ đám mây khác. Các bit được gửi đến một trung tâm dữ liệu và lưu trữ tại đây, sau đó, chúng chỉ xuất hiện khi khách hàng muốn. Để làm được như vậy, chúng tôi phải chứng minh rằng điều ấy mang tính thực tế từ quan điểm tự động hóa”, Karin Strauss - nhà nghiên cứu chính của Microsoft cho biết.

Ceze phát biểu: “Nó có thể chỉ ra một loại hệ thống mới có thành phần điện tử và thành phần phân tử, cho phép chúng ta xây dựng một hệ thống tích hợp các phân tử ướt và điện tử khô. Và chúng sẽ kết hợp để làm nên điều gì đó tuyệt vời”. 

Russinovich tin rằng tiềm năng lưu trữ dữ liệu khổng lồ của DNA là một trường hợp đáng để nghiên cứu. Đây là bước tiếp theo cho thấy công nghệ này thực sự khả thi. Vẫn có những vấn đề kỹ thuật cực kỳ khó giải quyết trong việc tạo ra quy mô này. Nhưng họ đang vững bước trên hành trình ấy. 

Lưu trữ dữ liệu ảnh 3 chiều

Với thế hệ chuyên gia trung tâm dữ liệu hiện nay, lưu trữ ảnh 3 chiều có vẻ là một bước nhảy vọt dễ dàng hơn so với DNA. Trong một hệ thống ba chiều, dữ liệu trong chùm ánh sáng quang học được lưu trữ dưới dạng hình ảnh bên trong một tinh thể liti niobate.

Bộ nhớ ba chiều có khả năng ghi và đọc hàng triệu bit song song, cho tốc độ truyền dữ liệu cao hơn tốc độ đạt được bằng bộ lưu trữ quang học truyền thống.

Dự án HSD là cú bắt tay giữa Microsoft Research Cambridge và Microsoft Azure nhằm tạo ra một hệ thống bộ nhớ ảnh 3 chiều, như là một thiết kế ưu tiên đám mây, xây dựng dựa trên những tiến bộ gần đây trong lĩnh vực công nghệ quang học, chẳng hạn như camera của smartphone.

“Để thực hiện lưu trữ ảnh ba chiều, chúng tôi cần những chiếc camera có độ phân giải cao. Nếu xem xét những chiếc máy ảnh được trang bị trên điện thoại thông minh ngày nay, chúng tôi thấy chúng đã đạt đến độ phân giải mà mình cần – trong phạm vi 10s megapixel – để thương mại hóa một công nghệ như thế. Chúng tôi thực sự đã tạo ra một vài tiến bộ tuyệt vời”, Russinovich nói.

Lưu trữ dữ liệu ảnh 3 chiều.

Lưu trữ dữ liệu ảnh 3 chiều.

Anh tiếp tục: “Chúng tôi đã có thể đọc và ghi để mở khóa tốc độ truy cập tương thích với các ổ đĩa cứng. Chúng tôi cũng đã tận dụng phần mềm bù đắp thông qua khả năng học sâu để đọc ra với độ chính xác cao, dữ liệu được lưu trữ trong bộ nhớ ảnh 3 chiều. Chúng tôi hiện đã nắm trong tay bằng chứng cho các khái niệm”. 

Từ quan điểm thiết kế trung tâm dữ liệu, bộ nhớ ảnh 3 chiều có lẽ là cách thích ứng dễ dàng hơn DNA, vì nó chỉ đơn giản là thay thế một phương tiện lưu trữ khác và các yếu tố hình thức mới.

Những công nghệ này đang đạt được tiến bộ nhanh chóng, nhưng có thể còn nhiều năm nữa mới được triển khai trên quy mô lớn. Ngay cả khi các công nghệ mới tỏ ra khả thi, chúng cũng sẽ được áp dụng dần dần theo thời gian, cho các đơn vị khai thác trung tâm dữ liệu thời gian để thích ứng với các thiết kế và thực tiễn tốt nhất.

Ví dụ, điện toán đám mây là một trong những xu hướng công nghệ thông tin đột phá nhất. Amazon Web Service đã giới thiệu nền tảng đám mây của họ từ năm 2006, và 14 năm theo Gartner, ước tính rằng có khoảng 30% cửa hàng công nghệ doanh nghiệp sử dụng hình thức lưu trữ đám mây. Các giải pháp làm nguội chất lỏng hiệu quả đã xuất hiện trong nhiều năm qua, và vẫn đang được chấp nhận. Sự thay đổi đến chậm nhất với các khu vực quan trọng nhất của trung tâm dữ liệu, chắc chắn bao gồm cả lưu trữ.

Song, sự quan tâm của Microsoft đối với những công nghệ này nhấn mạnh sự đổi mới cao cấp khi làm việc với các khách hàng trung tâm dữ liệu siêu cấp, những người thúc đẩy sự phát triển và lớn mạnh của chiến lược kinh doanh trung tâm dữ liệu. Các nhà cung cấp dịch vụ đặt mục tiêu vào thị trường này cần phải tính đến công nghệ mà các công ty trên đang áp dụng và các thông số kỹ thuật cần thiết để hỗ trợ họ.

 

Bài viết liên quan


0913.111111

Chỉ đường

Chat FB

Chat Zalo

0913.111111