Sản phẩm - Dịch vụ

AI là một kẻ ngốn năng lượng, nhưng DeepSeek có thể thay đổi điều đó

React Plus Group
10 Feb 2025 09:02

Error Image

DeepSeek tuyên bố rằng mô hình AI của họ tiêu thụ ít năng lượng hơn so với các đối thủ, giúp giảm gánh nặng cho các trung tâm dữ liệu AI. Các phương pháp đào tạo hiệu quả của DeepSeek sử dụng ít giờ GPU hơn và chi phí thấp hơn đáng kể, đặt ra một câu hỏi quan trọng: Liệu AI có thể phát triển mà không trở thành "kẻ ngốn năng lượng"?

Nếu cách tiếp cận của DeepSeek thực sự tối ưu hóa tài nguyên, nó có thể mở ra một hướng đi bền vững hơn cho hạ tầng AI. Tuy nhiên, tác động môi trường của mô hình này vẫn chưa rõ ràng. Một mặt, mức tiêu thụ năng lượng giảm có thể giúp hạn chế dấu chân carbon của ngành AI. Mặt khác, theo nghịch lý Jevons, khi công nghệ trở nên hiệu quả hơn và rẻ hơn, nhu cầu sử dụng có thể gia tăng, dẫn đến việc mở rộng quy mô các trung tâm dữ liệu và thậm chí tiêu thụ nhiều năng lượng hơn trước.

Liệu DeepSeek có thực sự tạo ra bước ngoặt trong việc giảm thiểu tác động môi trường của AI hay chỉ là một mắt xích trong vòng lặp tiêu thụ năng lượng ngày càng gia tăng? Câu trả lời vẫn cần thêm thời gian để kiểm chứng.

Nội dung

[English below]

 AI là "một kẻ ngốn năng lượng" nhưng DeepSeek có thể thay đổi điều đó

Tuyên bố của DeepSeek về mô hình AI của họ sử dụng ít năng lượng tính toán hơn nhiều so với các đối thủ cạnh tranh như Llama 3.1 của Meta có tác động đáng kể đến môi trường. Mặc dù điều này có thể làm giảm bớt gánh nặng cho các trung tâm dữ liệu AI tiêu tốn nhiều năng lượng và ô nhiễm của chúng, nhưng vẫn còn quá sớm để biết liệu cách tiếp cận của DeepSeek có thực sự cách mạng hóa tác động của AI đến môi trường hay không, đặc biệt là khi xét đến các kế hoạch mở rộng trung tâm dữ liệu của các công ty khác.

“Có một sự lựa chọn trong vấn đề này.”

Các phương pháp đào tạo AI hiệu quả của DeepSeek, sử dụng ít giờ GPU và chi phí hơn đáng kể so với các mô hình như Llama 3.1 của Meta, chứng minh rằng AI không nhất thiết phải là "kẻ ngốn năng lượng", theo các chuyên gia. Các mô hình V3 và R1 của họ, đặc biệt là thành công nhanh chóng của cửa hàng ứng dụng sau, đã làm rung chuyển ngành, thậm chí tác động đến cổ phiếu của Nvidia. Chiến lược "không mất mát phụ trợ" của DeepSeek đào tạo có chọn lọc các bộ phận mô hình, tiết kiệm năng lượng trong cả quá trình đào tạo và suy luận (thông qua các kỹ thuật như lưu trữ giá trị khóa). Bản chất nguồn mở của các mô hình của họ (trừ dữ liệu đào tạo) thúc đẩy sự hợp tác và minh bạch, có khả năng dân chủ hóa quá trình phát triển AI.

Có một con dao hai lưỡi cần phải xem xét

Tiềm năng chứng minh AI tiên tiến không đòi hỏi nguồn lực lớn của DeepSeek có thể dẫn đến việc lập kế hoạch cơ sở hạ tầng bền vững hơn và khuyến khích các phòng thí nghiệm AI lớn phát triển các thuật toán hiệu quả hơn. Trong khi một số công ty, như Rystad Energy, vẫn còn hoài nghi về tuyên bố về năng lượng của DeepSeek, thì hiệu quả được cho là của công ty này có thể làm giảm đáng kể mức tiêu thụ năng lượng của trung tâm dữ liệu và giải phóng các nguồn năng lượng tái tạo cho các lĩnh vực khác. Tuy nhiên, nghịch lý Jevons cho thấy rằng hiệu quả tăng lên cũng có thể dẫn đến việc sử dụng AI tăng lên, có khả năng bù đắp cho các lợi ích về môi trường.

Ngay cả khi có khả năng giảm năng lượng AI, vẫn có lo ngại rằng chi phí thấp hơn có thể khuyến khích mở rộng quy mô lớn các trung tâm dữ liệu, có khả năng phủ nhận các lợi ích về hiệu quả. Mặc dù tác động của DeepSeek vẫn chưa chắc chắn, nhưng điều quan trọng là phải xem xét nguồn năng lượng: Trung Quốc phụ thuộc vào than và Hoa Kỳ tiếp tục sử dụng nhiên liệu hóa thạch, bao gồm cả khí đốt, để cung cấp năng lượng cho trung tâm dữ liệu làm dấy lên mối lo ngại về ô nhiễm. Các trung tâm dữ liệu cũng tiêu thụ một lượng nước đáng kể. Trong khi các trung tâm dữ liệu truyền thống trước đây đã kiểm soát được nhu cầu điện mặc dù khối lượng công việc ngày càng tăng, thì những tiến bộ của AI đã thúc đẩy mức tiêu thụ năng lượng tăng đột biến. Việc dự báo mức sử dụng năng lượng trong tương lai vẫn còn nhiều thách thức.

-

AI is ‘an energy hog,’ but DeepSeek could change that

DeepSeek's claim its AI model uses far less computing power than competitors like Meta's Llama 3.1 has significant potential environmental implications. While this could lessen the strain on energy-intensive AI data centers and their pollution, it's too soon to tell if DeepSeek's approach will truly revolutionize AI's environmental impact, especially given other companies' data center expansion plans.

“There’s a choice in the matter.”

DeepSeek's efficient AI training methods, using significantly fewer GPU hours and cost than models like Meta's Llama 3.1, demonstrate AI doesn't have to be an "energy hog," according to experts. Their V3 and R1 models, particularly the latter's rapid app store success, have shaken the industry, even impacting Nvidia's stock. DeepSeek's "auxiliary-loss-free" strategy selectively trains model parts, saving energy during both training and inference (through techniques like key value caching). The open-source nature of their models (minus training data) fosters collaboration and transparency, potentially democratizing AI development.

There is a double-edged sword to consider

DeepSeek's potential to demonstrate that advanced AI doesn't require massive resources could lead to more sustainable infrastructure planning and incentivize major AI labs to develop more efficient algorithms. While some, like Rystad Energy, remain skeptical about DeepSeek's energy claims, its purported efficiency could significantly reduce data center energy consumption and free up renewable energy resources for other sectors. However, the Jevons paradox suggests that increased efficiency could also lead to increased AI usage, potentially offsetting environmental gains.

Even with potential AI energy reductions, there's concern that lower costs could incentivize massive expansion of data centers, potentially negating efficiency gains. While DeepSeek's impact remains uncertain, it's crucial to consider the energy source: China's reliance on coal and the US's continued use of fossil fuels, including gas, for data center power raises pollution concerns. Data centers also consume significant water. While traditional data centers previously managed to control power demand despite increasing workloads, AI advancements have driven a surge in energy consumption. Forecasting future energy use remains challenging.

-------------------------

REACT PLUS GROUP

Công ty công nghệ chuyên phát triển các hệ thống Fintech và cung cấp các giải pháp trong lĩnh vực tài chính tại Nhật Bản.

>Trụ sở Hà Nội: Tầng 7, toà nhà Golden Field, 24 Nguyễn Cơ Thạch, Nam Từ Liêm, Hà Nội

>Trụ sở Đà Nẵng: Tầng 11, Bella Building, 220 Nguyễn Hữu Thọ, Hoà Cường Bắc, Hải Châu, Đà Nẵng

>Trụ sở Nhật Bản:Mirai Plus - CANAL GATE SHIBAURA Bldg. 6th-floor, 4-12-38, Shibaura, Minato-ku, Tokyo, 108-0023, Japan

Hotline: 024 6299 7777

Email: hrm@reactplus.com

Website: https://www.reactplus.com

#reactplus #RPG #yourquality_ourpriority #bigname_biggame #Tetnguyendan2025

 

tiktok

© React Plus, JSC 2021. All rights reserved.