f21: Giới thiệu về Gemini 2.0 Flash Thinking Experimental

Blog


Giới thiệu về Gemini 2.0 Flash Thinking Experimental

Tìm hiểu về Gemini 2.0 Flash Thinking Experimental, bao gồm các tính năng, giới hạn và so sánh nó với các mô hình suy luận khác.

Năm 2025 được dự đoán là một năm bùng nổ của trí tuệ nhân tạo (AI), đặc biệt là trong lĩnh vực các mô hình lý luận. Sự ra mắt của Deepseek Reasoner đã mở màn cho một cuộc cạnh tranh khốc liệt. Ngay sau đó, Google đã giới thiệu Gemini 2.0 Flash Thinking Experimental, một mô hình đầy hứa hẹn cho phép người dùng trải nghiệm thông qua Google AI Studio và Gemini API.

Tương tự như các mô hình suy luận khác như GPT của OpenAI và Reasoner của Deepseek, Gemini 2.0 Flash Thinking Experimental không chỉ đơn thuần đưa ra câu trả lời. Thay vào đó, nó tập trung vào việc thể hiện rõ ràng quá trình suy nghĩ của mình. Mô hình này chia nhỏ các bước suy luận, đánh giá các lựa chọn khác nhau và trình bày lý luận một cách minh bạch, giúp người dùng hiểu rõ hơn cách nó đạt được kết luận.

Bài viết này sẽ đi sâu vào Gemini 2.0 Flash Thinking Experimental, khám phá các tính năng, giới hạn và cách bạn có thể tận dụng sức mạnh của nó.

Gemini 2.0 Flash Thinking Experimental là ?

Gemini 2.0 Flash Thinking Experimental là một mô hình AI mới được Google thiết kế đặc biệt để nâng cao khả năng lý luận. Ban đầu, mô hình này chỉ được cung cấp thông qua Google AI Studio và Gemini API, nhưng hiện tại, nó đã được triển khai cho người dùng ứng dụng Gemini.

Điểm nổi bật của Gemini 2.0 Flash Thinking Experimental là khả năng đa phương thức. Điều này có nghĩa là nó có thể xử lý cả văn bản và hình ảnh làm đầu vào. Nhờ đó, mô hình có thể được sử dụng cho các tác vụ đòi hỏi ngữ cảnh trực quan, chẳng hạn như:

  • Giải thích sơ đồ kỹ thuật

  • Phân tích biểu đồ dữ liệu phức tạp

  • Trích xuất thông tin chi tiết từ các tài liệu chuyên ngành

Tuy nhiên, khác với một số mô hình đa phương thức khác, Flash Thinking chỉ tạo ra đầu ra dựa trên văn bản. Điều này có nghĩa là nó không tạo ra hình ảnh hoặc dữ liệu trực quan để phản hồi. Thay vào đó, nó tập trung vào việc giải thích quá trình suy nghĩ của mình bằng văn bản một cách chi tiết và có cấu trúc.

Một trong những tính năng vượt trội của Gemini so với các mô hình khác là cửa sổ ngữ cảnh cực lớn. Gemini hỗ trợ tối đa 1 triệu token cho đầu vào và có thể tạo ra phản hồi lên đến 64.000 token. Đây là một trong những mô hình AI có khả năng xử lý ngữ cảnh dài nhất hiện nay, cho phép nó phân tích toàn bộ cuốn sách, tài liệu nghiên cứu hoặc các cuộc trò chuyện dài mà vẫn duy trì được tính mạch lạc.

Tính năng này đảm bảo rằng mô hình có thể theo dõi các lập luận phức tạp trong suốt quá trình tương tác mở rộng, giảm bớt sự cần thiết phải liên tục giới thiệu lại ngữ cảnh cho mô hình.

Tuy nhiên, cần lưu ý một hạn chế quan trọng: Kiến thức của Flash Thinking bị giới hạn đến tháng 6 năm 2024. Điều này có nghĩa là nó không có kiến thức được tích hợp về các sự kiện xảy ra sau thời điểm đó.

Do đó, mô hình có thể đưa ra các thông tin sai lệch hoặc các giả định không chính xác. Ví dụ, trong trường hợp được đề cập, vì nó chưa từng nghe về Gemini 2.0 Flash Thinking Experimental (vì nó ra mắt sau tháng 6/2024), nó đã không trả lời chính xác về thời điểm ra mắt của chính mình!

Tích hợp Gemini 2.0 Flash Thinking Experimental với các ứng 

Để giải quyết giới hạn kiến thức được đề cập ở trên, Google đã tích hợp chức năng YouTube, Maps và Tìm kiếm vào Gemini 2.0 Flash Thinking Experimental. Bạn có thể bật chức năng này từ menu thả xuống mô hình

Lưu ý rằng việc sử dụng các công cụ này không đảm bảo câu trả lời chính xác tuyệt đối. Ví dụ, trong trường hợp ngày phát hành, mặc dù nó đã đưa ra một câu trả lời gần đúng hơn (21/1/2025 so với ngày phát hành thực tế là 6/2/2025), nhưng vẫn chưa hoàn toàn chính xác.

Một điểm thú vị khác của Gemini 2.0 Flash Thinking Experimental là khả năng tự động lựa chọn các công cụ cần thiết dựa trên yêu cầu của người dùng. Ví dụ, khi được hỏi về tuyến đường lái xe ngắn nhất từ đường Vũ Trọng Phụng đến khu vực Cổ Nhuế, mô hình đã tự động chọn công cụ Google Maps. Bạn có thể thấy biểu tượng Google Maps hiển thị bên dưới và mô hình cũng đề cập đến việc sử dụng công cụ Google Maps trong quá trình suy luận của nó.

Đánh giá hiệu suất của Gemini 2.0 Flash Thinking Experimental

Gemini 2.0 Flash Thinking Experimental của Google đã cho thấy những cải tiến đáng kể trong các nhiệm vụ dựa trên lý luận, vượt trội so với những người tiền nhiệm của nó trong nhiều điểm chuẩn chính (tập trung vào toán học, khoa học và tái tạo đa phương thức).

Tiêu chí

Gemini 1.5 Pro

Gemini 2.0 Flash

Gemini 2.0 Flash

AIME2024 (Toán)

19.3%

35.5%

73.3%

GPQA Diamond (Khoa học)

57.6%

58.6%

74.2%

MMMU (Lý luận đa phương )

64.9%

70.7%

75.4%

Nguồn: Google

Cũng giống như chúng ta đã thấy với các mô hình suy luận khác, khả năng suy luận của 2.0 Flash Thinking mở rộng quy mô với tính toán suy luận tăng lên (xem biểu đồ bên dưới). Điện toán suy luận đề cập đến lượng sức mạnh tính toán được sử dụng sau khi bạn đưa ra lời nhắc cho mô hình.

: Google

Cách truy cập Gemini 2.0 Flash Thinking Experimental

Google đã cung cấp Gemini 2.0 Flash Thinking Experimental thông qua nhiều nền tảng, bao gồm cả quyền truy cập trực tiếp cho người dùng Gemini.

Gemini Chat (Gemini App & Web)

Cách dễ nhất để truy cập Gemini 2.0 Flash Thinking là thông qua giao diện trò chuyện Gemini của Google, có sẵn cả trong ứng dụng web Gemini và ứng dụng di động Gemini.

Tại thời điểm đăng tải bài viết này, quyền truy cập vào 2.0 Flash Thinking đã có sẵn miễn phí cho tất cả người dùng.

Google AI Studio

Google AI Studio là một cách khác để sử dụng Gemini 2.0 Flash Thinking. Nền tảng dựa trên web này hướng đến những người dùng nâng cao hơn và nó cho phép bạn thử nghiệm khả năng suy luận của mô hình, kiểm soát các thông số như nhiệt độ, kiểm tra các truy vấn phức tạp, khám phá các phản hồi có cấu trúc, v.v.

LOSA AI

Ngoài hai cách trên, hiện nay, bạn cũng có thể truy cập và sử dụng miễn phí mô hình Gemini 2.0 Flash Thinking Experimental tại LOSA AI. Không chỉ riêng Gemini 2.0 Flash Thinking Experimental, LOSA AI tích hợp nhiều mô hình ngôn ngữ lớn trên thế giới đầy đủ và nhanh chóng, để bạn có thể trải nghiệm tất cả các mô hình ngôn ngữ trên cùng một tài khoản.

Conclusion

Gemini 2.0 Flash Thinking Experimental là một bước tiến mới của Google trong cuộc đua phát triển các mô hình AI lý luận, hiện đã có sẵn cho người dùng ứng dụng Gemini. Điểm nổi bật của mô hình này là khả năng giải thích quá trình suy nghĩ, cấu trúc phản hồi từng bước và sử dụng các công cụ tích hợp như Tìm kiếm, YouTube và Maps.

Mặc dù đầy hứa hẹn, Flash Thinking vẫn phải đối mặt với những thách thức như độ chính xác chưa hoàn hảo và sự phụ thuộc vào các nguồn bên ngoài. Với việc OpenAI và DeepSeek cũng đang nâng cao các mô hình lý luận của họ, sẽ rất thú vị khi chứng kiến sự cạnh tranh trong lĩnh vực này phát triển như thế nào trong tương lai.


Content menu