• Hành trình bắt đầu
    sử dụng Codeium thấy thú vị, muốn thử nghiệm dự án, tự học AI từ con số 0

  • thử nghiệm AI Chat tại nhà
    chạy trên máy cá nhân với card AMD và dùng llama.cpp để thử nghiệm mô hình GGUF

  • kết quả khi sử dụng AI opensource là không thể chấp nhận
    Chi phí vận hành lớn khi dùng AI trên máy cá nhân, card AMD không hỗ trợ tốt cho AI do driver không có sẵn, CUDA trên NVIDIA mới vận hành hiệu quả. (Kết quả: thất bại)

  • Đổi hướng lần 1: AI hỏi đáp pháp luật sử dụng OpenAI
    Dựa vào kiến thức và kinh nghiệm trong ngành luật để lấy văn bản pháp luật Việt Nam về, sau đó dựa vào kết quả tìm được để trả lời câu hỏi liên quan.

  • Sử dụng RAG và xử lý 10.000 văn bản luật từ vbpl.vn
    LLamaindex và Langchain trừu tượng quá mức nên khó tùy biến, phải sử dụng API cấp thấp để thao tác trực tiếp với AI thông qua API. Việc xử lý văn bản cũng gặp nhiều khó khăn, việc cắt văn bản thành hàng nghìn mảnh với từng điều khoản. RAG bị phân mảnh quá mức do văn bản trải dài từ 1945 đến 2022. Chưa kể đa ngành nghề đa lĩnh vực, văn bản thì chồng chéo và quan hệ điều chỉnh phức tạp. Lấy dữ liệu gặp khó khăn khi xác định tính hiệu lực của văn bản. Tốn thêm 1 lớp đa truy vấn (multi query) để viết lại câu hỏi người dùng (rewrite query) và 1 lớp để sắp xếp lại câu trả lời (reranking).

  • ra mắt bản dùng thử cho luật sư và nhận phản hồi
    Phản hồi từ phía luật sư: tỉ lệ trả lời đúng, thấp dưới 45%, câu hỏi xuyên suốt nhiều văn bản hiển nhiên không thể trả lời nổi do quá lớn. vbpl.vn cung cấp dữ liệu kém gồm thiếu văn bản luật hiện thành, server vbpl.vn thường xuyên mất kết nối do bị spam bởi các trang web pháp luật craw, văn bản dù lấy được nhưng là pdf ảnh không thể xử lý. Tập khách hàng quá bé và không thể trả tiền. Chi phí vận hành quá lớn. Training mô hình chuyên dụng nói Tiếng Việt cho ngành luật là quá đắt, trong khi sử dụng RAG cho văn bản pháp luật lại không hiệu quả. (kết quả: thất bại)

  • Đổi hướng lần 2: trình soạn thảo AI
    ứng dụng AI trong công việc viết lách, xử lý văn bản dài giúp tiết kiệm thời gian và chi phí.

  • Hoàn thiện và thử nghiệm dịch văn bản
    Dịch thành công luật lao động 2019 với 80 trang văn bản. Kết quả dịch cho ra chất lượng tương đương google dịch. Có chỗ tốt hơn, tuy nhiên kết quả kém khi dịch tiểu thuyết do không duy trì được văn phong, giao diện kém thân thiện khó dùng, khách hàng phản hồi tạm nhưng không sẵn sàng trả tiền. (kết quả: thất bại)

  • Đổi hướng lần 3: quay về nền tảng cơ bản, AI Chat
    AI Chat giúp trả lời các câu hỏi của người dùng, giải quyết vấn đề từ đơn giản đến phức tạp, giải quyết giới hạn khi sử dụng AI ở Việt Nam

  • Kết nối API với các nền tảng, trò chuyện với nhiều nhân vật khác nhau.
    Đa nhân vật giúp người dùng giải quyết vấn đề cụ thể trong chuyên ngành mà không phải tạo prompt, sử dụng prompt có sẵn từ thư viện. (500 prompt)

  • AI soạn thảo
    AI soạn thảo tái khởi động, thất bại trong lần thử nghiệm trước do thiếu ổn định. Lần này loại bỏ tính năng 2 màn hình và làm mượt lại cẩn thận, chỉ để duy nhất tính năng soạn thảo lại

  • Chính thức ra mắt

  • User trả phí đầu tiên
    Chúc mừng dự án đã có người dùng trả phí đầu tiên, sau 1 năm phát triển. Thị trường Việt Nam thực sự kiếm tiền rất khó. Cạnh tranh lớn, mức sống thấp nên người dùng ít có khả năng chi trả. gói 20$ ChatGPT = tiền tiết kiệm 7.2 cốc cafee, trong khi 500k = tiền tiết kiệm 20 cốc cafee ở Việt Nam mới dùng được. Tuy nhiên mình vẫn muốn phát triển ứng dụng ở Việt Nam, vì mình thích đất nước mình. Hi vọng tương lai mọi người ai cũng dùng AI ở Việt Nam vào 2025, 2 cốc cafee giá 50k / tháng có lẽ sẽ làm được ước mơ này.

  • Quản lý file và xuất bản
    Nền tảng cho mọi thứ, đẩy 1 lượng lớn file vào dự án. Sau đó cho phép khả năng chia sẻ xuất bản, thậm chí kế thừa từ người khác sẽ giúp nâng cao khả năng kiến thức của người Việt Nam. Bản chất của tính năng quản lý file dựa trên cảm hứng từ Visual Studio Code, còn khả năng kế thừa dựa trên Github. Vì suy cho cùng, AI chỉ là công cụ. Kiến thức mới là thứ quan trọng, và kiến thức của một người thì không thể đủ mạnh, ai cũng truyền kinh nghiệm cho con cháu và người nhà hay cùng môn phái thì kiến thức sớm muộn sẽ mai một. Kế thừa code của người khác giúp Losa phát triển nhanh đến vậy như ngày hôm nay. Vì vậy tính năng dự án, giúp lưu trữ kiến thức nên được kế thừa để giúp bât kì ai nhanh chóng vun đắp tiếp mà không cần phải xây lại!

  • Tái cấu trúc
    Losa tái tạo với diện dạo mới. Losa 1.0 chính thức sẵn sàng ra mắt. Mục tiêu hướng đến là AI soạn thảo, AI trò chuyện tiện lợi thú vị và nhanh nhất