Jeff Dean, Giám đốc khoa học Google chia sẻ về hành trình phát triển Gemini, mô hình AI đa phương thức mới nhất của Google, cũng như những thay đổi đáng chú ý trong lĩnh vực.
Jeff Dean là đồng sáng lập của Google Brain, Google Translate, Gemini.
Jeff Dean là đồng sáng lập của Google Brain, Google Translate, Gemini. |
Hội nghị Trí tuệ Nhân tạo tạo sinh 2024 vừa được tổ chức tại TP.HCM với chủ đề “Chân Trời Mới” (Uncharted Frontiers), quy tụ nhiều tên tuổi đáng chú ý trong lĩnh vực AI trên thế giới.
Bài phát biểu trực tiếp của Jeff Dean, Giám đốc khoa học của Google, chuyên gia AI hàng đầu thế giới được đặc biệt quan tâm. Ông là đồng sáng lập của Google Brain, Google Translate, Gemini và nhiều sản phẩm đã giúp Google thống trị ngành công nghệ toàn cầu.
AI đã thay đổi thế nào trong những năm qua
"Trong những năm gần đây, máy học và AI thực sự đã thay đổi kỳ vọng của con người về những gì chúng ta có thể làm được với máy tính”, Jeff Dean mở đầu bài phát biểu.
Chúng ta thường nghĩ rằng máy tính là những cỗ máy khô khan, đơn sắc. “Nhưng giờ đây, chúng đã có thể hiểu những thông tin mà chỉ có con người mới thấu hiểu. Đây là tác vụ mà chúng chưa bao giờ làm được trước kia”, ông phân tích.
Theo Jeff Dean, máy tính nói chung và AI nói riêng đã chuyển từ từ các hệ thống đơn giản, dựa trên các bộ quy tắc có sẵn thành các mô hình phức tạp có khả năng hiểu thông tin phức tạp. Việc mở rộng quy mô các hệ thống AI bằng cách sử dụng các hệ thống điện toán khổng lồ, bộ dữ liệu đào tạo lớn hơn, tăng kích thước mô hình.
“Tất cả đều là chìa khóa giúp Google cải thiện kết quả của các hệ thống AI, từ đó khiến chúng ngày càng cao cấp hơn”, Giám đốc khoa học Google nói.
Nhưng với Jeff Dean, điều thú vị nhất về AI tạo sinh trong những năm qua là con người đã có thể đảo ngược cách họ từng sử dụng AI.
Trước đây, kho dữ liệu đầu vào chỉ bao gồm hình ảnh, đoạn âm thanh hoặc đoạn văn đơn giản để AI dịch thuật, chuyển đổi thành văn bản. Hiện tại, mọi quy trình hoàn toàn có thể ngược lại bởi người dùng sẽ nhập câu lệnh để AI trả về hình ảnh, video do chính nó tạo ra.
Đó cũng chính là cảm hứng ra đời mô hình Gemini tại Google. "Chúng tôi đã phát triển loạt mô hình Gemini để xử lý các nguồn dữ liệu đầu vào đa dạng và tạo ra các đầu ra khác nhau, cho dù đó là văn bản, hình ảnh hay âm thanh”, Jeff Dean giải thích.
Gemini là minh chứng cho tầm nhìn muốn tạo ra một mô hình AI vượt qua các ranh giới truyền thống tại Google.
“Gemini được thiết kế theo hướng đa phương thức ngay từ những ngày đầu. Điều này có nghĩa là nó có thể xử lý đồng thời thời các loại đầu vào khác nhau, chẳng hạn như văn bản kết hợp với hình ảnh hoặc video. Sau đó, nó tạo ra các đầu ra tương ứng ở nhiều định dạng, bao gồm hình ảnh, văn bản hoặc thậm chí là âm thanh”, ông nói tại GenAI Summit 2024.
Khả năng đa phương thức này cho phép Gemini giải quyết nhiều vấn đề hiệu quả hơn bằng cách tận dụng vốn hiểu biết toàn diện của mình trên nhiều phương tiện khác nhau.
Đơn cử như tính năng tạo hình ảnh từ văn bản của Gemini cho phép người dùng cung cấp mô tả chi tiết và nhận được hình ảnh chất lượng tốt, chân thực. Tương tự, khả năng tạo âm thanh của chatbot cho phép tạo ra nội dung âm thanh phù hợp với các kịch bản hoặc ngữ cảnh cụ thể.
Những cỗ máy đứng sau Gemini
Để đạt được những khả năng ấn tượng như vậy, Gemini được xây dựng trên nền tảng của những công nghệ tiên tiến.
"Chúng tôi sử dụng kỹ thuật Mixed Precision Training”, Dean nói. Thay vì sử dụng các số có độ chính xác cao (32 bit), Google chỉ sử dụng 16 bit. Điều này giúp giảm đáng kể lượng dữ liệu cần lưu trữ và tăng tốc quá trình tính toán, trong khi vẫn đảm bảo độ chính xác.
Tương tự như khi chúng ta làm tròn một con số, đôi khi việc làm tròn một chút sẽ không làm thay đổi kết quả cuối cùng, nhưng lại giúp chúng ta tính toán nhanh hơn rất nhiều.
Bên cạnh đó, Jeff Dean cũng nhắc đến thuật ngữ Model parallelism (Song song mô hình) - là một đổi mới quan trọng không kém đối với Gemini. “Thay vì phân chia dữ liệu trên nhiều chip, chúng tôi chia nhỏ chính mô hình AI”, ông phân tích.
Bằng cách chia mô hình thành các đoạn chạy trên các chip riêng biệt và chỉ giao tiếp tại các điểm cần thiết, cách làm này giúp tăng tốc quá trình đào tạo và nâng cao hiệu suất, đặc biệt là đối với các mô hình quy mô lớn như Gemini.
Ông nhấn mạnh việc tối ưu hóa data pipelines (đường ống dữ liệu) là rất quan trọng trong quá trình đào tạo Gemini. Đây là phương pháp nhập dữ liệu thô từ nhiều nguồn dữ liệu khác nhau, sau đó được chuyển đến kho lưu trữ dữ liệu để phân tích. Tuy nhiên, nhược điểm của cách làm này là thời gian đợi dữ liệu được tải vào bộ nhớ và xử lý có thể gây tắc nghẽn trong việc huấn luyện các mô hình lớn.
“Chúng tôi sử dụng một đường ống tải và tiền xử lý dữ liệu chạy song song với hiệu suất cao”, ông giải thích. Điều này đảm bảo rằng GPU liên tục được cung cấp dữ liệu, giảm thiểu thời gian ngừng hoạt động và tối đa hóa hiệu quả đào tạo. Đường ống dữ liệu được sắp xếp hợp lý là yêu cầu quan trọng để duy trì thông lượng và hiệu suất cao trong quá trình đào tạo các mô hình phức tạp.
Trong bài phát biểu tại GenAI Summit 2024, Giám đốc khoa học Google cũng đánh giá cao hệ thống giáo dục mạnh mẽ của Việt Nam, nơi đang nuôi dưỡng nhiều nhà tiên phong AI tương lai. “Tôi tin rằng tiềm năng AI thay đổi thế giới là rất rộng mở. Trong đó, Việt Nam đang ở vị thế có lợi nhờ hệ thống giáo dục mạnh mẽ, đưa nhiều nhân tài đến với lĩnh vực này”, ông khẳng định.
Bên cạnh các bài phát biểu chính của các chuyên gia như Jeff Dean hay TS. Lương Minh Thắng, hội nghị còn có các phiên thảo luận bàn tròn cho phép các đại biểu tham gia vào các cuộc thảo luận sâu về nhiều khía cạnh của AI.
Các cuộc thảo luận này bao trùm một phổ rộng các chủ đề, từ các tác động đạo đức của AI trong xã hội đến tiềm năng của AI trong việc thúc đẩy tăng trưởng kinh tế ở các thị trường mới nổi như Việt Nam.
Là hội nghị thượng đỉnh về GenAI đầu tiên tại Việt Nam, GenAI Summit 2024 - Uncharted Frontiers tập hợp những bộ óc thông minh nhất trong ngành AI, tạo nền tảng kết nối cộng đồng trí tuệ nhân tạo trong nước với các chuyên gia trên toàn thế giới.
Việc GenAI Summit 2024 lần đầu được tổ chức tại Việt Nam cho thấy các chuyên gia, các nhà đầu tư ngày càng tin tưởng vào hệ sinh thái đổi mới sáng tạo và tiềm năng trở thành hub công nghệ khu vực của Việt Nam.
Tin mới
- Microsoft và Quantinuum tạo bước đột phá trong lĩnh vực máy tính lượng tử - 20/10/2024 02:02
- Phần mềm độc hại TrickMo đánh cắp mã PIN Android bằng màn hình khóa giả mạo - 17/10/2024 02:03
- Ôn tập và thi cấp chứng chỉ Ứng dụng công nghệ thông tin thang 9-2024 - 05/09/2024 15:56
- Triển khai, thực hiện Tăng cường bảo đảm an toàn thông tin trong việc kết nối, chia sẽ, dữ liệu quốc gia về dân cư với Hệ thống thông tin giải quyết TTHC của tỉnh - 29/08/2024 07:29
- Một số tài khoản bạn bắt buộc phải bật tính năng xác thực hai lớp - 19/08/2024 09:08
Các tin khác
- OpenAI ra mắt GPT-4o mini: Công cụ AI mạnh mẽ với giá cả phải chăng - 20/07/2024 08:47
- Màn hình thế giới 'phủ xanh' vì sự cố của Microsoft - 20/07/2024 08:44
- Kỳ thi Đánh giá tư duy của Đại học Bách khoa Hà Nội tại Trường Đại học Hà Tĩnh - 10/06/2024 01:21
- Đề cử các đơn vị, cá nhân nhận giải thưởng Chuyển đổi số - 28/05/2024 09:27
- Cảnh báo sự cố An toàn thông tin mạng trong thời đại chuyển đổi số - 16/05/2024 00:52