Kỹ sư phần mềm bằng AI đầu tiên trên thế giới

Ngày 13/3, Cognition Labs, startup về công nghệ trí tuệ nhân tạo tại Mỹ, công bố kỹ sư phát triển phần mềm AI đầu tiên trên thế giới. “Devin là một đồng đội tài năng và không biết mệt, sẵn sàng làm cùng bạn hoặc tự hoàn thành nhiệm vụ để bạn đánh giá. Với Devin, các kỹ sư có thể tập trung vào những vấn đề thú vị hơn, các đội kỹ thuật có thể nỗ lực cho những mục tiêu tham vọng hơn”, Cognition cho biết.


Đây là sản phẩm của một nhóm kỹ sư đang làm việc tại nhiều công ty lớn như Google DeepMind, Waymo, Scale AI, được dẫn dắt bởi các kỹ sư gồm Scott Wu, Steven Hao và Walden Yan. Dù hoạt động một thời gian, Cognition Labs mới thực sự được thành lập vào đầu năm nay và gọi vốn được 21 triệu USD. Trong phần giới thiệu, họ mô tả mình là một “nhóm nhỏ nhưng nhiều tài năng”, với những người sáng lập từng giành được 10 huy chương vàng Olympic Tin học quốc tế.

Trước Devin, thế giới cũng có những trợ lý AI hỗ trợ lập trình như Github Copilot hoặc các chatbot ChatGPT, Google Bard. Tuy nhiên, Devin khác biệt vì có thể xử lý toàn bộ quá trình phát triển từ đầu đến cuối.

Trong video giới thiệu, Scott Wu, CEO của Cognition Labs, đã mô tả cách người dùng Devin có thể viết code ban đầu, theo dõi dòng lệnh, kiểm tra và sửa lỗi, thậm chí quản lý những dự án trên nền tảng như Upwork. Devin có thể tìm kiếm trên Internet để học cách hoàn thành nhiệm vụ. Nhờ đó, các kỹ sư sẽ có trong tay một nhân viên AI đầy đủ năng lực để tham gia dự án thay vì một trợ lý chỉ có thể gợi ý những đoạn code.

Để sử dụng, người dùng nhập câu lệnh bằng ngôn ngữ tự nhiên vào giao diện kiểu chatbot của Devin và kỹ sư AI này sẽ xử lý tiếp. Nó sẽ lên kế hoạch chi tiết để giải quyết vấn đề theo từng bước.

Tiếp theo, Devin sẽ khởi động dự án bằng cách sử dụng những công cụ dành cho nhà phát triển. Nó sẽ viết code, khắc phục lỗi, kiểm tra và báo cáo tiến trình theo thời gian thực, cho phép người dùng theo dõi mọi thứ và đề phòng những điều ngoài ý muốn. Nếu thấy sai sót, người dùng có thể vào giao diện chat và ra lệnh cho AI thực hiện thay đổi. Điều này giúp các đội kỹ thuật giao một số nhiệm vụ của mình cho AI và tập trung vào các dự án sáng tạo hơn, đòi hỏi trí thông minh của con người.

Trong thử nghiệm của Bloomberg, Devin có thể lập trình trò chơi Pong cơ bản và tạo một trang web trong chưa đầy 20 phút.

Theo công bố của nhà phát triển, khi đánh giá dựa trên tiêu chuẩn SWE-Bench về việc giải quyết các vấn đề trên GitHub, Devin giải quyết chính xác 13,86% các vấn mà không cần hỗ trợ. Trong khi với mô hình trước đó, hiệu suất chỉ đạt 1,96% và cao nhất là 4,80% nếu được hỗ trợ.

Tuy nhiên, hiện Devin chưa được cung cấp rộng rãi mà chỉ dành cho một số người dùng đã đăng ký trước và được chọn. Nhà phát triển cho biết sản phẩm này chỉ là bước đầu trong việc phát triển các kỹ sư AI của mình.

“Chúng tôi đang phát triển những đồng đội AI với khả năng vượt xa công cụ AI hiện nay. Bằng cách giải quyết vấn đề lý luận, chúng tôi có thể mở ra những khả năng mới trong nhiều lĩnh vực – code chỉ là bước khởi đầu. Chúng tôi muốn giúp mọi người trên thế giới biến ý tưởng của họ thành hiện thực”, Cognition giải thích.

Sản phẩm của Cogniton Labs được đánh giá là minh họa rõ nhất cho nhận định trước đó của nhà sáng lập Nvidia Jensen Huang. Tại một sự kiện cuối tháng 2 vừa qua, ông Huang từng gây sốc khi khuyên người trẻ không học viết mã.

Theo ông, con người đang ở giai đoạn đầu của cuộc cách mạng AI và lập trình không còn là kỹ năng quan trọng nữa. Ông cho rằng trí tuệ nhân tạo đang đảm nhận công việc này ngày một tốt, do đó con người nên tập trung vào các chuyên môn có giá trị hơn như sinh học, giáo dục, sản xuất hoặc nông nghiệp.

Chia sẻ bài viết này

Trong hoàn cảnh hiện nay, khi xã hội ngày càng phát triển thì yêu cầu

Theo Forbes, việc ứng dụng AI giúp giảm chi phí thiết kế, cải thiện năng

Theo Forbes, thế giới công nghệ đang được chứng kiến một cuộc chiến tương tự

Nhóm nhà khoa học dữ liệu tại công ty phân tích Dun & Bradstreet (DNB)

Thực tế ảo (VR) từng là công nghệ thu hút nhiều chú ý giai đoạn

Theo Bloomberg, Apple đã lên kế hoạch dừng tìm kiếm nhân viên mới và hạn

Scroll to Top