Cuộc đua chuyển hướng của AI

Ngành trí tuệ nhân tạo (AI) đang trải qua một sự chuyển dịch mang tính nền tảng. Sau giai đoạn đẩy mạnh phát triển các mô hình ngôn ngữ lớn (LLM) ở tốc độ chưa từng có thông qua cung cấp thêm dữ liệu và tăng cường năng lực tính toán, các công ty AI hàng đầu như OpenAI đang thừa nhận những hạn chế của phương pháp “nhồi nhét nhiệt tình” này.

 Thay vì chỉ đơn thuần theo đuổi các mô hình có kích thước lớn hơn, một kỷ nguyên mới đang đến - các công ty AI đang chuyển hướng tập trung vào việc tinh chỉnh các mô hình hiện có và bổ sung cho chúng khả năng lập luận giống con người hơn. Sự chuyển dịch này có ý nghĩa sâu sắc đối với cuộc chay đua AI đang diễn ra cùng các nguồn lực thúc đẩy nó.

Mô hình "o1" mới được OpenAI công bố là minh chứng cho sự thay đổi chiến lược này. Thay vì chỉ tăng quy mô, o1 kết hợp các kỹ thuật tiên tiến như "tính toán suy luận". Phương pháp này cho phép mô hình khám phá và đánh giá nhiều giải pháp tiềm năng trước khi chọn ra con đường tối ưu, mô phỏng quá trình cân nhắc của tư duy con người.

Cách tiếp cận này tỏ ra đặc biệt hiệu quả đối với các nhiệm vụ phức tạp đòi hỏi lập luận và ra quyết định sắc bén, chẳng hạn như các bài toán hoặc đoạn mã phức tạp. Tại hội nghị TED về AI mới đây ở San Francisco (Mỹ), nhà nghiên cứu Noam Brown của OpenAI đã nhấn mạnh tác động đáng kể của kỹ thuật này: chỉ cần 20 giây “suy luận" của mô hình đã đạt được hiệu suất tương đương với việc tăng kích thước và thời lượng huấn luyện của mô hình lên tới 100.000 lần.

Ngoài tính toán thời gian kiểm tra, o1 còn được hưởng lợi từ cách tiếp cận chọn lọc dữ liệu, kết hợp phản hồi và kiến thức chuyên môn từ các tiến sĩ và chuyên gia trong ngành. Sự kết hợp giữa đào tạo chuyên biệt và mô hình cơ sở như GPT-4 góp phần tạo nên khả năng xử lý và lập luận phức tạp của o1.

OpenAI đã báo hiệu ý định mở rộng cách tiếp cận đào tạo phân lớp này sang các mô hình cơ sở có quy mô còn lớn hơn GPT-4, cho thấy cam kết dài hạn đối với chiến lược tinh chỉnh này. Ông Kevin Weil, Giám đốc Sản phẩm của OpenAI, nhấn mạnh quyết tâm duy trì lợi thế cạnh tranh của họ và tuyên bố ý định "đi trước ba bước" trong bối cảnh ngành AI đang phát triển vũ bão.

Sự thay đổi chiến lược của OpenAI cũng phản ánh một xu hướng rộng hơn trong ngành. Theo các nguồn thạo tin, các công ty phát triển AI lớn khác như Anthropic, xAI và Google DeepMind được cho là đang theo đuổi các kỹ thuật tương tự OpenAI - đặc biệt khi những hạn chế từ cách tiếp cận mở rộng mô hình thông qua “nhồi nhét” dữ liệu và khả năng tính toán đang ngày càng rõ ràng.

Việc đào tạo những mô hình khổng lồ này là một nỗ lực tốn kém, với mỗi "lần huấn luyện" cần đến hàng trăm chip chạy đồng thời và phát sinh chi phí hàng chục triệu USD. Những hệ thống phức tạp này dễ bị lỗi phần cứng và các nhà nghiên cứu thường phải mất nhiều tháng chờ đợi vì không thể xác định hiệu suất của mô hình cho đến khi kết thúc quá trình huấn luyện kéo dài.

Tác động của sự thay đổi này không chỉ đối với việc phát triển mô hình mà còn ảnh hưởng đáng kể đến phần cứng. Trong khi Nvidia đang thống trị thị trường chip huấn luyện, xu hướng ngày càng chú trọng vào khả năng suy luận của AI có thể tạo cơ hội cho các đối thủ cạnh tranh. Khả năng suy luận của AI yêu cầu một loại kiến trúc chip khác và Nvidia có thể phải đối mặt với cạnh tranh gay gắt hơn trong thị trường mới nổi này.

Tuy nhiên, bản chất năng động của ngành AI đồng nghĩa cuộc cạnh tranh giành vị trí thống trị trong phân khúc quan trọng này còn lâu mới kết thúc. Một mô hình AI thông minh hơn không chỉ đơn giản là có quy mô lớn hơn mà còn phải biết thích nghi, đổi mới trong môi trường luôn thay đổi nhanh chóng này.