Jennifer Dewan
Jennifer.Dewan@tii.ae
Falcon Arabic: Ngoài tiếng Anh và các ngôn ngữ gốc châu Âu, Falcon nay đã hỗ trợ tiếng Ả Rập – mở rộng sang thị trường Ả Rập với vai trò là mô hình AI tiếng Ả Rập đứng đầu về hiệu suất trong khu vực
Falcon-H1 đặt lại tiêu chuẩn về hiệu suất và tính di động, vượt trội hơn so với LlaMA của Meta và Qwen của Alibaba – thúc đẩy việc ứng dụng AI trên các thiết bị phổ thông và trong điều kiện hạn chế tài nguyên
Viện Đổi mới Công nghệ (TII) của UAE – đơn vị nghiên cứu ứng dụng thuộc Hội đồng Nghiên cứu Công nghệ Cao cấp Abu Dhabi (ATRC) hôm nay vừa công bố hai đột phá lớn trong lĩnh vực trí tuệ nhân tạo: Falcon Arabic mô hình ngôn ngữ tiếng Ả Rập đầu tiên trong dòng Falcon – hiện là mô hình AI tiếng Ả Rập có hiệu suất cao nhất khu vực, và Falcon-H1, đặt lại tiêu chuẩn về hiệu suất và tính di động nhờ thiết kế mô hình bên trong hoàn toàn mới. Trong phân khúc mô hình AI quy mô vừa (30–70 tỷ tham số), Falcon-H1 vượt trội so với các đối thủ cùng tầm như LlaMA của Meta và Qwen của Alibaba, cho phép triển khai AI thực tiễn trên thiết bị phổ thông và trong điều kiện hạn chế tài nguyên. Thông báo trên được đưa ra trong bài phát biểu quan trọng của Ngài Faisal Al Bannai, Cố vấn của Tổng thống UAE và Tổng thư ký ATRC, tại sự kiện Make it in the Emirates.
Falcon Arabic được xây dựng dựa trên Falcon 3-7B (7 tỷ tham số), là một trong những mô hình AI tiếng Ả Rập tiên tiến nhất được phát triển cho đến nay. Được huấn luyện trên tập dữ liệu tiếng Ả Rập bản địa chất lượng cao – bao gồm cả tiếng Ả Rập hiện đại chuẩn và các phương ngữ vùng miền – mô hình này phản ánh đầy đủ sự phong phú và đa dạng của ngôn ngữ Ả Rập. Theo bảng xếp hạng Open Arabic LLM Leaderboard, Falcon Arabic vượt qua tất cả các mô hình ngôn ngữ tiếng Ả Rập hiện có trong khu vực, khẳng định vị thế dẫn đầu trong lĩnh vực AI đa ngôn ngữ có tính chủ quyền. Đây được xếp hạng là mô hình tiếng Ả Rập có hiệu suất tốt nhất trong phân khúc, ngang bằng với các mô hình có quy mô gấp 10 lần — minh chứng cho việc thiết kế thông minh có thể vượt trội so với quy mô khổng lồ.
Falcon-H1 được thiết kế đặc biệt nhằm mở rộng phạm vi tiếp cận các hệ thống AI hiệu suất cao bằng cách thu hẹp yêu cầu về xử lý và kỹ thuật thường gặp khi vận hành các hệ thống tiên tiến. Thông báo này tiếp nối thành công của dòng TII Falcon 3 từng thuộc nhóm mô hình AI hàng đầu thế giới có thể vận hành chỉ trên một đơn vị xử lý đồ họa (GPU) – một đột phá quan trọng giúp các nhà phát triển, startup và tổ chức không sở hữu hạ tầng cao cấp có thể triển khai AI tiên tiến một cách hiệu quả và tiết kiệm.
“Chúng tôi vô cùng tự hào khi cuối cùng đã tích hợp tiếng Ả Rập vào Falcon, và càng tự hào hơn khi mô hình ngôn ngữ lớn có hiệu suất cao nhất trong khối Ả Rập được phát triển ngay tại UAE,” Ngài Faisal Al Bannai phát biểu tại sự kiện Make it in the Emirates ở Abu Dhabi. Về Falcon-H1, ông nói: “Ngày nay, vị thế dẫn đầu trong AI không còn đến từ việc mở rộng quy mô. Mà là tạo ra công cụ mạnh mẽ nhưng hữu ích, dễ sử dụng và phổ cập. Falcon-H1 phản ánh cam kết của chúng tôi trong việc mang đến AI phục vụ cho tất cả mọi người – không chỉ số ít.”
Falcon-H1 tiếp tục hỗ trợ các ngôn ngữ gốc châu Âu và lần đầu tiên được mở rộng để hỗ trợ hơn 100 ngôn ngữ, nhờ bộ tokenizer đa ngôn ngữ được huấn luyện trên tập dữ liệu phong phú và đa dạng.
Thông minh, Tinh giản, và Toàn diện hơn
Falcon-H1 được phát triển để đáp ứng nhu cầu toàn cầu ngày càng tăng về các hệ thống AI hiệu quả, linh hoạt và dễ sử dụng. Falcon-H1, với “H” đại diện cho thiết kế pha trộn sức mạnh của Transformers và Mamba, mang lại tốc độ suy luận nhanh hơn đáng kể và giảm tiêu thụ bộ nhớ, đồng thời duy trì hiệu suất cao trên nhiều bộ tiêu chuẩn đánh giá.
“Chúng tôi không xem Falcon-H1 chỉ là một cột mốc nghiên cứu mà còn là thách thức kỹ thuật: làm thế nào để đạt hiệu suất vượt trội mà không thỏa hiệp,” Tiến sĩ Najwa Aaraj, CEO của TII chia sẻ. “Mô hình này thể hiện cam kết của chúng tôi trong việc xây dựng hệ thống có độ chính xác kỹ thuật cao và ứng dụng thực tiễn. Falcon không chỉ còn là một mô hình – nó là nền tảng hỗ trợ các nhà nghiên cứu, nhà phát triển và nhà sáng tạo, đặc biệt trong những điều kiện hạn chế tài nguyên nhưng đầy khát vọng.”
Dòng Falcon-H1 bao gồm các mô hình với kích thước đa dạng: 34B, 7B, 3B, 1.5B, 1.5B-deep, và 500M. Các mô hình này cung cấp cho người dùng một dải rộng tỷ lệ giữa hiệu suất và hiệu quả, cho phép nhà phát triển chọn mô hình phù hợp nhất với từng tình huống triển khai. Trong khi các mô hình nhỏ hơn hỗ trợ triển khai trên thiết bị đầu cuối thông minh với tài nguyên giới hạn, mô hình chủ lực 34B vượt trội hơn hẳn các mô hình cùng loại của Meta (LlaMA) và Alibaba (Qwen) trong các tác vụ phức tạp.
“Dòng Falcon-H1 chứng minh cho ta thấy thiết kế mới có thể mở ra những cơ hội mới trong huấn luyện AI, đồng thời thể hiện tiềm năng của các mô hình siêu nhỏ gọn,” Tiến sĩ Hakim Hacid, Trưởng bộ phận Nghiên cứu AI và Khoa học số tại TII cho biết. “Dòng Falcon-H1 về cơ bản đã thay đổi phạm vi thực hiện các tác vụ trên các thiết bị nhỏ nhất, cho phép AI vận hành một cách mạnh mẽ và trực tiếp trên thiết bị đầu cuối thông minh với quyền riêng tư, hiệu quả và độ trễ thấp là yếu tố then chốt. Trọng tâm của chúng tôi là giảm độ phức tạp mà không làm suy giảm năng lực.”
Mỗi mô hình trong dòng Falcon-H1 cho hiệu suất vượt trội so với các mô hình có kích thước gấp đôi, thiết lập tiêu chuẩn mới về tỷ lệ hiệu suất – hiệu quả. Các mô hình này cũng thể hiện xuất sắc trong các tác vụ toán học, lý luận, lập trình, xử lý ngữ cảnh dài và đa ngôn ngữ.
Tầm ảnh hưởng quốc tế
Các mô hình Falcon hiện đang được ứng dụng rộng rãi trong thực tế. Khi hợp tác với Quỹ Bill & Melinda Gates, Falcon đã hỗ trợ phát triển AgriLLM – một giải pháp giúp nông dân ra quyết định thông minh hơn trong điều kiện khí hậu khắc nghiệt. Hệ sinh thái Falcon của TII đã được tải về hơn 55 triệu lần trên toàn cầu và được công nhận rộng rãi là dòng mô hình AI mã nguồn mở mạnh mẽ và nhất quán nhất từ khu vực Trung Đông.
Trong khi nhiều mô hình AI khác chỉ tập trung vào các ứng dụng tiêu dùng hạn hẹp, TII đã ưu tiên phát triển các mô hình nền tảng có khả năng thích ứng với yêu cầu khắt khe của ngành công nghiệp, nghiên cứu và lợi ích cộng đồng, đồng thời vẫn giữ được tính dễ tiếp cận. Các mô hình này được thiết kế để áp dụng trong nhiều tình huống thực tế khác nhau, luôn duy trì tính dễ tiếp cận, tiết kiệm tài nguyên, và thích nghi với các điều kiện đa dạng.
Tất cả các mô hình Falcon đều có mã nguồn mở và có sẵn trên Hugging Face và FalconLLM.TII.ae theo Giấy phép TII Falcon, dựa trên Apache 2.0, được thiết kế để khuyến khích phát triển AI một cách có trách nhiệm và đạo đức.
Văn bản ngôn ngữ nguồn ban đầu của thông báo này là phiên bản chính thức, có thẩm quyền. Các bản dịch được cung cấp chỉ như một sự điều chỉnh thích nghi, và sẽ được tham chiếu chéo với văn bản ngôn ngữ nguồn, đây là phiên bản duy nhất của văn bản có hiệu lực pháp lý.
Jennifer Dewan
Jennifer.Dewan@tii.ae