ChatGPT, hồi sinh cho loa thông minh.
Dịch vụ trợ lý trí tuệ nhân tạo đã nổi lên trong cuộc cạnh tranh quyết liệt kể từ khi Alexa ra đời vào năm 2014. Từ năm 2018, các loại loa thông minh khác nhau đã được ra mắt, cho phép trợ lý trí tuệ nhân tạo được sử dụng không chỉ thông qua ứng dụng điện thoại di động mà còn qua nhiều loại loa khác nhau.
Tuy nhiên, những chiếc loa thông minh này không mất quá lâu để trở thành một sự phiền toái. Đầu tiên, trợ lý trí tuệ nhân tạo không hiểu lời nói rất tốt. Họ thường nhầm những tín hiệu không có ý định làm lệnh và tỉnh giấc, làm xao lạc sự yên bình.
Hơn nữa, ngay cả khi họ hiểu lời nói, phản ứng của họ thường thiếu thốn. Họ chỉ có thể được sử dụng cho các nhiệm vụ cơ bản như kiểm tra thời tiết, đặt báo thức, phát nhạc và nghe radio, và không có nhiều sự giúp đỡ khi trả lời câu hỏi hoặc tìm kiếm thông tin.
Nhờ có ChatGPT, những chiếc loa thông minh và trợ lý trí tuệ nhân tạo thế hệ đầu tiên đang có cơ hội bay lên một lần nữa. Vào tháng 8 năm 2022, Amazon đã giới thiệu một mô hình ngôn ngữ trí tuệ nhân tạo mới có thể cải thiện Alexa. Mô hình này được gọi là Alexa Teacher Models (AlexaTM) và đã cho thấy hiệu suất tuyệt vời trong việc dịch ngôn ngữ và tóm tắt văn bản trong nhiều ngôn ngữ khác nhau. Trước đó, vào năm 2021, Google đã thông báo một chatbot miễn phí có tên LaMDA, một mô hình trí tuệ nhân tạo có thể trò chuyện với nhiều nhân cách khác nhau về nhiều chủ đề.
Một công ty khởi nghiệp có tên Gorilla Technology đã tung ra một ứng dụng có tên Super Chat, cho phép trò chuyện với các nhân vật lịch sử hoặc nhân vật nổi tiếng trên thế giới với nhân cách của họ. Các công ty khởi nghiệp tương tự cung cấp dịch vụ nhân cách trí tuệ nhân tạo như Poe từ Quora, Character.ai và D-ID cũng đang thu hút sự chú ý.
Ngoài ra, một công ty khởi nghiệp có tên CygniContGraVitas đã tung ra dịch vụ AutoGPT sử dụng GPT-4. Sau khi thiết lập mục tiêu cuối cùng cho trí tuệ nhân tạo, nó xác định một kế hoạch để thực hiện các nhiệm vụ khác nhau để đạt được mục tiêu và cố gắng thực hiện nó. Trong khi ChatGPT chỉ có thể đáp ứng các lệnh và câu hỏi của con người, AutoGPT có thể tự cải thiện và thực hiện các nhiệm vụ chi tiết khác nhau để đạt được mục tiêu sau mục tiêu và hướng dẫn ban đầu.
Ví dụ, nếu bạn ra lệnh “Tạo một triệu tài khoản Instagram để theo dõi,” AutoGPT sẽ chăm chỉ tạo ra nội dung và thực hiện các nhiệm vụ chi tiết khác nhau để đạt được mục tiêu này. Nếu những mô hình như vậy được áp dụng vào loa thông minh, chúng có thể cung cấp dịch vụ trò chuyện vượt xa mong đợi. Có lẽ trợ lý trí tuệ nhân tạo thế hệ đầu tiên sẽ có thể hiện thực hóa ý tưởng Jarvis trong bộ phim Iron Man.
Josh.ai, một công ty phát triển hệ thống tự động hóa nhà thông qua giọng nói được thành lập vào năm 2015, đã ra mắt một mô hình ngôn ngữ trí tuệ nhân tạo mới sử dụng API ChatGPT để cung cấp chức năng tự nhiên và thông minh hơn cho loa thông minh của họ so với các trợ lý trí tuệ nhân tạo hiện có. Nhờ có ChatGPT, ngay cả khi người dùng đặt câu hỏi sai hoặc vô lý khi xem xét ngữ cảnh, Josh có thể xem xét tình huống xung quanh và sửa chúng để hiểu và phản hồi một cách thích hợp.
Ngoài ra, nó có thể điều khiển các đối tượng xung quanh được liên kết với trợ lý trí tuệ nhân tạo một cách liên quan đến ngữ cảnh để cung cấp trải nghiệm dịch vụ tích hợp hơn. Ví dụ, nếu người dùng nói “Hôm nay tôi thực sự mệt mỏi. Có cách nào để thư giãn không?” loa thông minh Josh được kết nối với ChatGPT có thể đề xuất các kỹ thuật thư giãn như thiền hướng dẫn hoặc làm mờ ánh sáng và hiển thị video thư giãn từ YouTube trên TV.
Các sinh viên của Stanford đã phát triển một mẫu kính gọi là ‘RizzGPT’ kết hợp GPT-4 với kính để cung cấp một dịch vụ hiển thị các thông tin khác nhau qua kính dưới dạng văn bản khi nói chuyện với người khác.
Cuộc trò chuyện giữa người dùng và người khác được chuyển đổi thành văn bản thông qua kính thực tế tăng cường (AR), được kết nối với điện thoại thông minh và gửi đến ChatGPT. Ngoài ra, các thông tin về tình huống mà người dùng đang nhìn thấy, chẳng hạn như khuôn mặt của người khác, quần áo, trạng thái, các đối tượng xung quanh và môi trường, cũng được truyền đến GPT-4. Điều này cho phép trò chuyện trơn tru hơn bằng cách cung cấp thông tin không chỉ qua giọng nói mà còn về những gì đang diễn ra xung quanh người dùng.
Bằng cách giải thích thông tin được truyền đến GPT-4 và hiển thị nó dưới dạng văn bản qua kính, người dùng có thể có cuộc trò chuyện hiệu quả hơn. Trong tương lai, cũng sẽ có thể cung cấp thông tin bổ sung cho người dùng dưới dạng hình ảnh, video hoặc âm thanh.
Ví dụ, kính có thể cung cấp thông tin đúng lúc và chính xác trong khi đang diễn ra một bài giảng, một buổi thuyết trình quan trọng hoặc một dự án kết nối điện phức tạp, từ đó nâng cao giá trị của người dùng. Điều này là sự hiện thực hóa của Jarvis, mà chúng ta đã thấy trong các bộ phim. Nhờ vào công nghệ trí tuệ nhân tạo như mô hình ngôn ngữ lớn (LLM), cho phép các dịch vụ trí tuệ nhân tạo tổng quát như ChatGPT.
Vì vậy, ChatGPT sẽ có thể cung cấp các chức năng mới trước đây không thể có bằng cách tích hợp với loa thông minh, kính AR và các thiết bị IoT (Internet of Things) khác, và đảm bảo chất lượng dịch vụ tốt hơn so với trước đây. Tất nhiên, ChatGPT như vậy cũng có thể được tích hợp vào các robot, vượt qua vai trò chỉ là trợ lý ảo để giúp chúng ta, và có thể thậm chí có một hiện diện vật lý.
Đây là một khía cạnh khác của vấn đề trong đó ChatGPT nhập vào thực tế của chúng ta, không chỉ là ảo, và xã hội của chúng ta phải xem xét và chuẩn bị kỹ lưỡng cho tác động xã hội mà công nghệ này sẽ có, và áp dụng các biện pháp để đảm bảo công nghệ không gây đe dọa đến nhân loại.