Vào ngày 12 tháng 9, Tongyi Qianwen của Alibaba đã ra mắt kiến trúc mô hình Qwen3-Next và phiên bản kế tiếp Qwen3-Next-80B-A3B, giúp cải thiện hiệu suất cũng như khả năng ứng dụng của hệ thống.
Dòng Qwen3-Next được thiết kế với quá trình tối ưu hóa đào tạo vượt trội và cơ chế dự đoán đa token, với chi phí đào tạo chỉ dưới 10% so với mô hình Qwen3-32B trước đây, đảm bảo thông lượng suy diễn tiết kiệm và hiệu quả.
Để lại một bình luận
Bạn phải đăng nhập để gửi bình luận.