Bảy chương trình học có thể GPT đã học
Với tò mò đơn giản, tôi trở nên tò mò về những gì GPT có thể đã học. Tìm kiếm dữ liệu và loại học thuật theo cách thẳng thắn có vẻ hơi nhàm chán, vì vậy tôi tìm hiểu về những loại vấn đề được giải quyết trong lĩnh vực nghiên cứu xử lý ngôn ngữ tự nhiên.
Trang web Papers with Code phân loại 583 chủ đề nghiên cứu xử lý ngôn ngữ tự nhiên, mỗi chủ đề đều có nghĩa là “những nhà nghiên cứu trên thế giới đang nghiên cứu cùng một câu hỏi.” Có khả năng những loại vấn đề này đã được bao gồm trong một chương trình học nhỏ của những gì GPT học từ nội dung phong phú của nó.
Trong số đó, tôi đã chọn bảy chủ đề có liên quan mật thiết đến cuộc sống hàng ngày.
Tạo Văn Bản Từ Dữ Liệu
Chủ đề nghiên cứu này liên quan đến việc tạo ra văn bản mô tả từ dữ liệu “bảng” thường gặp. Đây là một nghiên cứu cần thiết cho năng suất của các nhà phân tích dữ liệu như tôi, và đồng thời, đây là một nghiên cứu ảnh hưởng đến việc làm việc (GPT không phải là thứ duy nhất ảnh hưởng đến công việc, phải không?).
Mô tả và diễn giải dữ liệu có thể khó khăn đối với máy móc nếu chúng được tự do tưởng tượng hoặc tiêm vào ý đồ quá nhiều. Quan trọng nhất, nó phải được diễn đạt một cách chính xác. Và mô tả này không đơn giản. Nó phải giải quyết đồng thời nhiều vấn đề phụ khác nhau, chẳng hạn như điều gì cần giải thích, điều gì cần tập trung và cách sử dụng biểu hiện để tăng tính rõ ràng.
Chuyển Đổi Kiểu Văn Bản
Nếu có “bắt chước giọng nói” trong nghiên cứu âm thanh, thì trong xử lý ngôn ngữ tự nhiên có “chuyển đổi kiểu” văn bản. Ví dụ, đó là kỹ thuật thay đổi kiểu diễn đạt của các người nói khác nhau trong khi vẫn giữ nguyên nghĩa của câu.
Bạn có thể chuyển từ “giọng điệu thoải mái” sang “nói với sự tức giận”, từ “kiểu nam tính” sang “kiểu nói của người phụ nữ”, và từ “câu từ trẻ con” sang “cú pháp của người lớn”.
Ví dụ, chuyển đổi lời giải thích kỹ thuật của Elon Musk về SpaceX thành phong cách diễn đạt của Harry Potter. Đó là một kỹ thuật để thay đổi kiểu diễn đạt của các người nói khác nhau trong khi vẫn giữ nguyên nghĩa của câu.
Dịch Ngôn Ngữ Y Khoa
Khi triệu chứng của chúng ta vượt qua một cơn cảm lạnh nhẹ, ngay cả khi chúng ta nghe được chẩn đoán của bác sĩ bằng ngôn ngữ mẹ đẻ, có thể cảm giác như một ngôn ngữ xa lạ. Để thu hẹp khoảng cách này, có một lĩnh vực nghiên cứu dịch các văn bản y khoa đầy thuật ngữ chuyên ngành thành một ngôn ngữ mà công chúng có thể hiểu.
Phân Loại Ý Định
Đơn giản nói, đó là một nghiên cứu về cách hiểu ý nghĩa của ai đó ngay cả khi họ không nói rõ. Ví dụ, trong một dịch vụ thương mại, nó có thể giúp xác định xem ai đó có muốn mua hàng, nâng cấp lên gói dịch vụ đắt hơn hay hủy bỏ gói dịch vụ của mình. Nếu đó là một trợ lý trò chuyện, nó có thể xác định các chủ đề liên quan từ vài từ mà người dùng để lại, và gợi ý thông tin mà người dùng có thể thấy hữu ích.
Hoàn Thiện Truyện
Nghiên cứu này nhằm mục đích điền vào các phần thiếu sót của một câu chuyện, ngay cả khi cốt truyện không hoàn hảo. Điều này có thể bao gồm đoán và liên kết mượt mà các phần thiếu sót của văn bản chính, không chỉ là kết luận. Nếu câu chuyện chứa quá nhiều thuật ngữ kỹ thuật hoặc yêu cầu nhiều kiến thức nền, có thể cung cấp chú thích để giúp người đọc theo dõi.
Ý nghĩa của nghiên cứu này không chỉ giới hạn trong tiểu thuyết, mà còn có thể được áp dụng trong cuộc sống hàng ngày. Nhiều người trở thành nạn nhân của “lời nguyền của tri thức”, cho rằng người khác đã biết những gì họ biết. Sẽ hữu ích nếu mô hình Hoàn Thiện Truyện có thể can thiệp như một trung gian kiến thức giữa mọi người.
Kể Chuyện Hình Ảnh
Nếu được cho một bức ảnh về một người chạy ra khỏi Ga Manhattan, có thể viết hai phiên bản giải thích như sau.
- “Có một người đang chạy tại lối ra 2 của Ga Manhattan. Có một cái cây, một con đường và một chiếc xe bên cạnh.”
- “Trễ lại một lần nữa hôm nay.”
Con người có thể hiểu ngữ cảnh và tạo ra một câu chuyện từ một bức ảnh duy nhất như thế này. Tuy nhiên, đây là một nhiệm vụ khó khăn đối với trí tuệ nhân tạo. Và việc cung cấp ngữ cảnh để kết nối nhiều hình ảnh thành một câu chuyện mạch lạc và cuối cùng tạo ra các câu là một cấp độ khác trong nghiên cứu Kể Chuyện Hình Ảnh.
Tạo Văn Bản Từ Khái Niệm
“Tạo văn bản dựa trên khái niệm” có chút khác biệt so với “Hoàn thiện câu chuyện,” đã được đề cập trước đó. Trong khi nghiên cứu hoàn thiện câu chuyện điền vào một ngữ cảnh trống rỗng, nghiên cứu được giới thiệu lần này tạo ra một câu có thể xảy ra với một số từ cho trước.
Lần này, tôi cũng đã giao cho GPT4 một nhiệm vụ. Tôi đã yêu cầu nó tạo ra một câu với bốn từ: “sáng sớm, cà phê, bánh mì, tàu điện ngầm.” Đối với GPT, đó có vẻ là một nhiệm vụ dễ dàng.
Anh ấy thức dậy sớm vào buổi sáng, đổ cho mình một tách cà phê, cắn một miếng bánh mì ấm, và đi đến ga tàu điện ngầm để làm việc.
Các nội dung được chọn từ bài viết này chỉ là một số ít trong số các chủ đề nghiên cứu đa dạng. Ngoài xử lý ngôn ngữ tự nhiên, lĩnh vực nghiên cứu trí tuệ nhân tạo bao gồm nhận dạng giọng nói, tạo hình/hoàn thiện ảnh/video và nhiều nội dung khác, vô tận. Bạn cũng có thể tạo ra những ý tưởng tuyệt vời bằng cách duyệt qua các chủ đề đã được nghiên cứu cho đến nay và suy nghĩ: “Tôi đã học những loại này, vì vậy tôi có thể mở rộng với những loại câu hỏi đó.” Hãy truy cập trang web này để khám phá một số ý tưởng tuyệt vời.