Sinh viên FPT Polytechnic và cơ sở dữ liệu vector

20:17 18/05/2025

Trong thời đại số, sinh viên và giảng viên tại FPT Polytechnic không chỉ làm việc với dữ liệu dạng bảng như Excel hay cơ sở dữ liệu SQL truyền thống, mà còn tiếp xúc với dữ liệu phi cấu trúc: văn bản, hình ảnh, âm thanh, video, v.v. Đây là những loại dữ liệu không thể dễ dàng “nhét” vào bảng, nhưng lại chứa đựng lượng thông tin khổng lồ và vô cùng giá trị.

Cơ sở dữ liệu vector – “trạm năng lượng” cho dữ liệu AI

Để khai thác hiệu quả dữ liệu phi cấu trúc, cơ sở dữ liệu vector (vector database) đóng vai trò cực kỳ quan trọng. Hãy tưởng tượng một thư viện số nơi sách được sắp xếp không theo thứ tự ABC, mà theo nội dung tương đồng – bạn tìm một tài liệu, hệ thống sẽ gợi ý những tài liệu gần giống về chủ đề, ngay cả khi tiêu đề hoàn toàn khác biệt.

Tại FPT Polytechnic, điều này mở ra khả năng ứng dụng trong:

  • Tìm kiếm thông minh tài liệu học tập, slide, giáo trình
  • Gợi ý bài giảng liên quan dựa trên nội dung sinh viên đang học
  • Hỗ trợ chatbot tra cứu kiến thức chuyên ngành

Vector embeddings – “mã DNA” của dữ liệu

Để xây dựng hệ thống tìm kiếm thông minh, mỗi văn bản hoặc hình ảnh cần được chuyển thành một vector embedding – một chuỗi số đặc trưng cho nội dung của dữ liệu. Đây chính là cách máy tính “hiểu” dữ liệu như con người hiểu ý nghĩa.

Mô hình embedding – người phiên dịch giữa dữ liệu và AI

Các mô hình embedding như Word2Vec, BERT hay các mô hình hiện đại của OpenAI sẽ chuyển đổi dữ liệu thành vector. Chúng hoạt động như những người phiên dịch thông minh, giúp AI “đọc hiểu” nội dung tài liệu, từ một bài luận văn đến một đoạn hội thoại chatbot trong hệ thống đào tạo.

HNSW – “cao tốc” cho tìm kiếm vector

Để việc tra cứu diễn ra nhanh chóng và chính xác, cấu trúc HNSW (Hierarchical Navigable Small World) giúp tổ chức dữ liệu vector như một hệ thống đường cao tốc – tìm nhanh, mở rộng tốt và vẫn đảm bảo độ chính xác.

Ứng dụng thực tế tại FPT Polytechnic

Cơ sở dữ liệu vector có thể được áp dụng trong nhiều lĩnh vực đào tạo và hỗ trợ sinh viên:

  • AI chatbot tra cứu thông tin học vụ, lộ trình học tập
  • Thư viện thông minh tự động gợi ý tài liệu học theo chuyên ngành
  • Hệ thống học tập tăng cường RAG (Retrieval-Augmented Generation), kết hợp truy xuất tài liệu với mô hình AI để giải thích nội dung chuyên sâu
  • Phân tích cảm xúc sinh viên qua bài viết phản hồi, diễn đàn học tập

Kết luận

Cơ sở dữ liệu vector không chỉ là một công nghệ mới mẻ, mà là chìa khóa giúp Sinh viên FPT Polytechnic nâng cao trải nghiệm học tập số, tạo nền tảng cho những ứng dụng AI thông minh, thân thiện và cá nhân hóa trong giáo dục.

Giảng viên Huỳnh Khắc Duy
Bộ môn Ứng dụng phần mềm
FPT Polytechnic TP HCM

Đăng ký nhận đề thi thử 2025

Cùng chuyên mục

Đăng ký nhập học tại FPT Polytechnic 2025

  • Max. file size: 50 MB.
  • Max. file size: 50 MB.
  • Max. file size: 50 MB.