HighTech

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google

Hóa ra nền tảng cho sức mạnh của ChatGPT lại đến từ chính các công trình nghiên cứu của Google.

23/01/2023 18:33

Nguyễn Hải - Thiết kế:Thành Đạt

Mới chỉ ra mắt từ cuối tháng 11 năm 2022, nhưng sự xuất hiện của ChatGPT đang tạo nên một cơn địa chấn đối với lĩnh vực nghiên cứu trí tuệ nhân tạo nói riêng cũng như với toàn ngành công nghệ nói chung. Với khả năng trình bày các câu trả lời một cách mạch lạc, chỉn chu như người thật, ChatGPT đã làm người dùng toàn cầu bất ngờ và thay đổi hoàn toàn cách nhìn về công nghệ AI mới này.

Nhiều nhà đầu tư đánh giá sự trỗi dậy ChatGPT đang mở ra một cuộc cách mạng công nghệ tương tự như việc internet hay iPhone xuất hiện trước đây. Điều này lý giải vì sao, bất chấp bối cảnh suy thoái toàn ngành công nghệ, OpenAI vẫn thu hút được vốn đầu tư với mức định giá lên đến 29 tỷ USD. Bên cạnh đó, nguồn vốn cũng đang đổ vào các startup về loại AI sản sinh (generative AI).

Trên thực tế, AI hay chatbot đều là các công nghệ đã được nói đến từ lâu nhưng chỉ đến sự xuất hiện của ChatGPT, mọi người mới nhận ra tiềm năng cũng như sức ảnh hưởng to lớn của các công nghệ này đối với thế giới. Vậy điều gì làm nên sự khác biệt cho ChatGPT so với những người tiền nhiệm mà khiến cả người khổng lồ công nghệ Google cũng phải run sợ?

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google - Ảnh 1.

Nhưng ít ai biết, trái tim cho khả năng giao tiếp như "nói chuyện với con người" của ChatGPT lại do chính các nhà nghiên cứu của Google phát triển và thực hiện mã nguồn mở cho nó: kiến trúc học sâu Transformer.

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google - Ảnh 2.

Kiến trúc này là nền tảng cho việc xây dựng nên các mô hình xử lý ngôn ngữ tự nhiên nổi tiếng như BERT của Google hay họ mô hình GPT (viết tắt của Generative Pre-trained Transformer) của OpenAI với các cái tên nổi tiếng bao gồm GPT-2 và GPT-3. Trong đó GPT-3 chính là nền tảng để tạo nên chatbot ChatGPT đang nổi tiếng hiện nay.

Không mấy nổi tiếng với công chúng nên ít ai biết rằng, sự xuất hiện của kiến trúc học sâu Transformer đã làm nên bước ngoặt cho các mô hình xử lý ngôn ngữ tự nhiên để từ đó tạo ra được một chatbot như ChatGPT. Để hiểu được tầm quan trọng này, cần biết được cách các cỗ máy xử lý ngôn ngữ con người như thế nào trước khi kiến trúc Transformer này ra đời.

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google - Ảnh 3.

Trước đây, các mô hình ngôn ngữ tự nhiên thường đi theo hướng xử lý tuần tự các từ ngữ. Ví dụ mô hình Word2Vec cho phép huấn luyện nên các AI có khả năng hiểu được những từ liên quan đến nhau, như khi bạn nói đến điện thoại, máy tính sẽ "liên tưởng" đến cả các từ khác như "điện thoại di động", "iPhone", "Android", "màn hình cảm ứng" … Sau đó kiến trúc Mạng thần kinh nhân tạo hồi quy (RNNs) ra đời cho phép xử lý tuần tự các câu trong một đoạn văn bản.

Nhưng việc huấn luyện theo cách tiếp cận này rất chậm chạp cũng như bị giới hạn về lượng dữ liệu có thể được huấn luyện, làm cho máy tính khó có thể liên kết ý nghĩa từng từ với bối cảnh của cả đoạn văn bản hoặc cả bài viết.

Năm 2018, mô hình mới có tên ELMo (Embeddings from Language Models) được giới thiệu và là mô hình đầu tiên có khả năng xử lý ngôn ngữ không tuần tự, nhằm mô phỏng cách con người đọc và xử lý văn bản.

Dùng kiến trúc RNNs, ELMo xử lý đoạn văn bản theo 2 chiều: đọc từ đầu đến cuối và ngược lại, đọc từ cuối lên đầu để sau đó kết hợp cả 2 chiều văn bản này để hiểu được ý nghĩa của nó. Mặc dù là một bước tiến dài về khả năng xử lý ngôn ngữ nhưng ELMo vẫn gặp khó khăn khi muốn huấn luyện nó với các câu hay các đoạn văn bản ngày càng dài hơn.

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google - Ảnh 4.

Khác với xử lý tuần tự từng từ, từng câu của các mô hình trước đó, kiến trúc Transformer của Google dựa trên cơ chế về sự chú ý (attention mechanism). Cơ chế này cho phép các mô hình xử lý ngôn ngữ dùng các lớp lọc sự chú ý (attention layer) để đánh giá được tầm quan trọng của các từ, các câu trong một đoạn văn bản dựa trên mức độ liên quan của nó đến toàn bộ văn bản đó.

Có thể nói mỗi lớp lọc sự chú ý này như một lần học hỏi thêm về đầu vào của dữ liệu, giúp xem xét các phần khác nhau của câu và khám phá thêm thông tin về ngữ nghĩa hoặc cú pháp. Các lớp lọc này cho phép mô hình vẫn duy trì được tốc độ học hỏi của mình không bị chậm đi khi độ dài của câu tăng lên. Khi đó, các mô hình xử lý chỉ việc bổ sung thêm các layer mới để lọc thêm và học hỏi thêm về dữ liệu mới. Nhờ các lớp lọc này, các mô hình có thể quét đồng thời toàn bộ văn bản và hiểu được ngữ nghĩa của nó.

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google - Ảnh 5.

Để so sánh, mô hình xử lý ngôn ngữ BERT nổi tiếng trước đây chứa 24 lớp lọc sự chú ý, GPT-2 – mô hình xử lý ngôn ngữ được OpenAI phát hành vào đầu năm 2019 – chứa 12 lớp lọc, trong khi đó GPT-3, mô hình làm nên ChatGPT hiện nay, chứa đến 96 lớp lọc sự chú ý.

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google - Ảnh 6.

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google - Ảnh 7.

Bên cạnh đó, không thể không kể đến một lợi ích khác của kiến trúc Transformer là khả năng sử dụng các mô hình được huấn luyện trước (các pre-trained models) – điều không xuất hiện cho đến khi ELMo ra mắt. Ý tưởng này tương tự như ImageNet, cơ sở dữ liệu khổng lồ các hình ảnh được gắn nhãn trước, giúp các mô hình nhận diện hình ảnh không phải huấn luyện từ đầu cho những công việc này.

Trong khi đó, các khối dữ liệu ngôn ngữ còn phức tạp, khó xử lý hơn nhiều so với các dữ liệu nhận diện hình ảnh. Do vậy, các mô hình xử lý ngôn ngữ cần nhiều dữ liệu hơn để nhận diện được mối quan hệ giữa các từ và các cụm từ. Do vậy, nếu không có các mô hình được huấn luyện trước, chỉ những người khổng lồ công nghệ mới đủ nguồn lực xử lý dữ liệu và huấn luyện các mô hình nhận diện dữ liệu đó, còn đối với các startup nhỏ, điều này là bất khả thi hoặc tiến triển rất chậm.

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google - Ảnh 8.

Các mô hình như GPT-3 được huấn luyện trên 45TB dữ liệu và chứa đến 175 tỷ thông số khác nhau – lớn vượt trội so với các mô hình nổi tiếng trước đây như BERT của Google, RoBERTa của Facebook, Turing NLG của Microsoft … . Khối dữ liệu của GPT-3 bao gồm hơn 8 triệu văn bản với 10 tỷ từ. Đây chính là nền tảng cho khả năng giao tiếp, trò chuyện làm nhiều người bất ngờ của ChatGPT.

Ngoài ra, một lợi ích khác của các mô hình huấn luyện trước là khả năng tinh chỉnh cho những tác vụ cụ thể mà không cần có sẵn nhiều dữ liệu. Ví dụ, đối với mô hình BERT, bạn chỉ cần vài nghìn mẫu dữ liệu là có thể tinh chỉnh mô hình cho một tác vụ mới nào đó. Còn với mô hình đã được huấn luyện với quá nhiều dữ liệu như GPT-3, chỉ cần được huấn luyện thêm với một lượng dữ liệu nhỏ cũng đủ để ChatGPT thực hiện một tác vụ mới, ví dụ như lập trình.

Trên thực tế, các yếu tố nói trên chỉ là những lợi thế về nền tảng công nghệ so với các chatbot và AI tiền nhiệm, còn để tạo nên ChatGPT với tiềm năng có thể thay đổi cả ngành công nghệ cũng như đe dọa đến vị thế của Google hiện nay, không thể không kể đến đội ngũ những nhà nghiên cứu AI bên trong OpenAI. Chính họ là người làm nên cốt lõi cho sự khác biệt mà ChatGPT đang mang lại.

Còn hơn cả một chatbot với khả năng giao tiếp như người thật, ChatGPT thực sự mở ra một cánh cửa mới cho tiềm năng trí tuệ nhân tạo và khả năng thay đổi nhiều ngành nghề kinh tế cả trong tương lai. Vì lý do đó, không khó hiểu khi thấy OpenAI đang được định giá đến 29 tỷ USD ngay cả khi chưa có mô hình kinh doanh cụ thể nào.

Bước đột phá của Samsung: Bản lề gập mới có thể xoay 360 độ

Tin cùng chuyên mục

Tỷ phú Phạm Nhật Vượng dừng hoàn toàn dịch vụ taxi bằng xe Vinfast VF 8

Nhà sáng lập GSM - tỷ phú Phạm Nhật Vượng công bố dừng hoàn toàn dịch vụ taxi Xanh SM Luxury bằng xe VinFast VF 8.

Ford Việt Nam ghi nhận doanh số kỷ lục, nâng cao trải nghiệm khách hàng

Tháng 11 vừa qua là tháng bán lẻ kỉ lục của Ford Việt Nam với tổng cộng 5.593 xe, phá kỉ lục của tháng 10 và của tất cả các tháng trong lịch sử bán hàng của thương hiệu xe Mỹ tại Việt Nam.

Khách hàng nhận thêm ưu đãi với Crossover của Năm

Ngay sau khi bất ngờ qua mặt cả Corolla Cross để giành giải Ô tô của năm 2024 phân khúc Crossover B+/C-, tân binh Subaru Crosstrek tung ngay gói ưu đãi bảo dưỡng xe miễn phí 1 năm (hoặc 20.000 km) cho các khách hàng mới trong năm 2024.

GAC "lôi kéo" khách với gói hậu mãi 7 năm miễn phí

GAC Việt Nam và nhà phân phối Tan Chong vừa đưa ra gói ưu đãi hậu mãi kỷ lục trên thị trường: 7 năm (hoặc 150.000 km) miễn phí cho khách hàng với 3 loại dịch vụ gồm bảo hành, cứu hộ 24/7 và nhân công bảo dưỡng.

Camry thế hệ mới chốt giá dẫn đầu phân khúc sedan cỡ D

Sau gần 2 tháng ra mắt tại Triển lãm ô tô Việt Nam, Camry thế hệ mới bắt đầu được bán ra thị trường từ tuần này với mức giá 1 tỷ 220 triệu đồng cho bản máy xăng và từ 1 tỷ 460 triệu đến 1 tỷ 542 triệu đồng cho các bản hybrid.

Triển vọng nào cho "Ô tô triển vọng của năm 2024"?

Danh hiệu Ô tô triển vọng của năm 2024 giải Car Awards mà Lynk & Co 06 giành được liệu có mang lại triển vọng doanh số cho mẫu xe CUV đô thị này trong năm 2025?

Maserati GranTurismo -– "Tay chơi" Italy trên đường Việt Nam

Thiết kế giao thoa giữa nghệ thuật điêu khắc Italy với hiệu suất cao của khối động cơ, giữa phong cách thể thao và sự sang trọng, chiếc Maserati GranTurismo Modena màu trắng ngọc thế hệ mới đầu tiên vừa có mặt tại TP.HCM với giá từ hơn 9 tỷ đồng.

V-Green hợp tác Fast+ triển khai 5.000 trụ sạc đến hết năm 2025

Công ty Cổ phần Phát triển Trạm sạc Toàn cầu V-GREEN và Công ty Cổ phần Trạm sạc Fast+ đã ký kết thoả thuận hợp tác nhượng quyền để lắp đặt 5.000 trụ sạc các loại dành riêng cho xe điện VinFast, công suất từ 7,4 KW đến 120 KW trên toàn quốc, từ nay đến hết năm 2025.

Giải mã sức mạnh ChatGPT - chatbot làm Google run sợ hóa ra của chính các nhà nghiên cứu tại Google

Tin cùng chuyên mục

Tỷ phú Phạm Nhật Vượng dừng hoàn toàn dịch vụ taxi bằng xe Vinfast VF 8

Ford Việt Nam ghi nhận doanh số kỷ lục, nâng cao trải nghiệm khách hàng

Khách hàng nhận thêm ưu đãi với Crossover của Năm

GAC "lôi kéo" khách với gói hậu mãi 7 năm miễn phí

Camry thế hệ mới chốt giá dẫn đầu phân khúc sedan cỡ D

Triển vọng nào cho "Ô tô triển vọng của năm 2024"?

Maserati GranTurismo -– "Tay chơi" Italy trên đường Việt Nam

V-Green hợp tác Fast+ triển khai 5.000 trụ sạc đến hết năm 2025

Tin mới nhất

Độc đáo khu phố bao cấp của Hà Nội được tái hiện trong "Đêm Trúc Bạch"

Đêm Trúc Bạch: Điểm đến của một Hà Nội quyến rũ, sâu lắng và đậm chất thơ

Bí ẩn những địa điểm được cho là cánh cổng dẫn tới thế giới khác đến nay vẫn chưa có lời giải

TP.HCM được Giải thưởng Du lịch thế giới chọn làm nơi trao giải

The Bubble Tea Factory: Bảo tàng trà sữa độc nhất vô nhị của đảo quốc Singapore

Cầu cảng đẹp như Hawai ở Hải Tiến khiến giới trẻ mê mệt, đã đến là phải check-in

Lái xe ô tô du Xuân và những lưu ý không thể bỏ qua

Những lễ hội khó lòng bỏ qua đầu Xuân Kỷ Hợi

Những địa danh Tây Bắc nhất định phải phượt đầu năm

Đến Chiang Mai, trải nghiệm một Thái Lan thật khác