Sự xuất hiện của AI chủ động (agentic AI) đang làm dấy lên cuộc đua tối ưu hiệu suất trong bối cảnh thiếu hụt bộ nhớ. Các hãng bán dẫn và nhà phát triển phần mềm đang chạy đua tìm giải pháp từ HBM4 đến thiết kế chip PIM và tối ưu mô hình.
AI chủ động — các hệ thống có khả năng tự thực hiện tác vụ và đưa ra quyết định — đòi hỏi nhiều băng thông và dung lượng nhớ hơn để chạy các mô hình lớn và quy trình tự động. Điều này làm tăng nhu cầu về bộ nhớ tốc độ cao, khiến ngành bán dẫn đối mặt với tình trạng khan hiếm tài nguyên bộ nhớ ở một số phân khúc.
Các nhà sản xuất đang đẩy mạnh cả về phần cứng lẫn phần mềm để giảm áp lực bộ nhớ: từ bộ nhớ HBM thế hệ mới, tới chip xử lý tại bộ nhớ (PIM) nhằm giảm lưu lượng dữ liệu qua bus, và tối ưu hoá mô hình AI để tiết kiệm bộ nhớ khi triển khai.
Để giảm rủi ro do khủng hoảng bộ nhớ, ngành công nghiệp có thể tập trung vào: tối ưu mô hình AI để giảm dung lượng cần thiết, phát triển kiến trúc bộ nhớ mới (như HBM thế hệ tiếp theo), triển khai PIM rộng rãi và mở rộng cơ sở hạ tầng sản xuất bán dẫn. Kết hợp phần mềm và phần cứng sẽ là chìa khóa để cân bằng giữa hiệu suất và nguồn cung bộ nhớ trong kỷ nguyên AI chủ động.
Nguồn: Koreajoongangdaily
Áp lực bộ nhớ từ AI chủ động
AI chủ động — các hệ thống có khả năng tự thực hiện tác vụ và đưa ra quyết định — đòi hỏi nhiều băng thông và dung lượng nhớ hơn để chạy các mô hình lớn và quy trình tự động. Điều này làm tăng nhu cầu về bộ nhớ tốc độ cao, khiến ngành bán dẫn đối mặt với tình trạng khan hiếm tài nguyên bộ nhớ ở một số phân khúc.
Giải pháp phần cứng và phần mềm
Các nhà sản xuất đang đẩy mạnh cả về phần cứng lẫn phần mềm để giảm áp lực bộ nhớ: từ bộ nhớ HBM thế hệ mới, tới chip xử lý tại bộ nhớ (PIM) nhằm giảm lưu lượng dữ liệu qua bus, và tối ưu hoá mô hình AI để tiết kiệm bộ nhớ khi triển khai.
Phản ứng của doanh nghiệp và chuỗi cung ứng
- SK hynix trưng bày các chip bộ nhớ HBM4 nhiều lớp, cho thấy hướng đầu tư vào bộ nhớ băng thông cao để đáp ứng nhu cầu AI.
- Samsung giới thiệu các giải pháp PIM tại hội nghị chuyên ngành, nhắm đến giảm tải cho bộ nhớ chính khi xử lý mô hình AI.
- Các cuộc gặp và đầu tư giữa các hãng lớn (ví dụ hợp tác chip và đầu tư từ các tập đoàn nước ngoài) cho thấy chuỗi cung ứng bán dẫn đang được củng cố để đối phó nhu cầu tăng vọt.
- Xuất khẩu chip bộ nhớ từ Hàn Quốc sang một số thị trường tăng mạnh, phản ánh sự dịch chuyển nhu cầu toàn cầu về linh kiện dành cho AI.
- Những tín hiệu lợi nhuận gia tăng ở các hãng bộ nhớ cho thấy doanh nghiệp đang hưởng lợi từ nhu cầu cao, đồng thời đầu tư mở rộng cơ sở sản xuất để giảm tắc nghẽn nguồn cung.
Hệ quả và xu hướng tương lai
Để giảm rủi ro do khủng hoảng bộ nhớ, ngành công nghiệp có thể tập trung vào: tối ưu mô hình AI để giảm dung lượng cần thiết, phát triển kiến trúc bộ nhớ mới (như HBM thế hệ tiếp theo), triển khai PIM rộng rãi và mở rộng cơ sở hạ tầng sản xuất bán dẫn. Kết hợp phần mềm và phần cứng sẽ là chìa khóa để cân bằng giữa hiệu suất và nguồn cung bộ nhớ trong kỷ nguyên AI chủ động.
Nguồn: Koreajoongangdaily
Bài viết liên quan
