Sitemap  Đăng nhập   
TRANG THÔNG TIN XÚC TIẾN ĐẦU TƯ TỈNH THÁI NGUYÊN
Chính phủ ban hành Danh mục bộ dữ liệu phục vụ phát triển trí tuệ nhân tạo trong các lĩnh vực thiết yếu
Theo Quyết định số 804/QĐ-TTg của Chính phủ ban hành ngày 06/5/2026 về danh mục bộ dữ liệu phục vụ phát triển trí tuệ nhân tạo trong các lĩnh vực thiết yếu; Nhà nước xác định dữ liệu là nền tảng cốt lõi để xây dựng hệ sinh thái AI quốc gia đồng bộ, mở và an toàn, phục vụ quản trị nhà nước và phát triển kinh tế số.
Anh-tin-bai

Danh mục gồm 15 nhóm dữ liệu quan trọng, bao quát các lĩnh vực như: ngôn ngữ tiếng Việt và tiếng dân tộc thiểu số; tri thức quốc gia; văn bản pháp luật và hành chính (không bao gồm văn bản mật); khoa học, công nghệ và đổi mới sáng tạo; dịch vụ công và thủ tục hành chính; y tế; giáo dục; nông nghiệp; giao thông và đô thị; tài nguyên và môi trường; kinh tế và thị trường; văn hóa, di sản và du lịch; bản đồ và không gian địa lý quốc gia; viễn thông và hạ tầng số; dữ liệu đa ngôn ngữ quốc tế về Việt Nam.

Bên cạnh đó là 5 nhóm dữ liệu ưu tiên triển khai để phục vụ trực tiếp cho phát triển AI, gồm:

Thứ nhất là dữ liệu phát triển mô hình ngôn ngữ lớn tiếng Việt, bao gồm ngôn ngữ phổ thông, hội thoại, tiếng nói, ngôn ngữ dân tộc thiểu số, dữ liệu báo chí – truyền thông, pháp luật, khoa học – kỹ thuật, mã nguồn, toán học, văn hóa – lịch sử, dữ liệu song ngữ và nguồn mở trên môi trường số.

Thứ hai là dữ liệu cho AI thị giác máy tính, với các bộ dữ liệu đa phương tiện, hình ảnh và video trong y tế, nông nghiệp, giao thông, đô thị, hạ tầng, vệ tinh và viễn thám.

Thứ ba là dữ liệu phục vụ kiểm thử, đánh giá hệ thống AI, tập trung vào năng lực hiểu và hội thoại tiếng Việt, hiểu biết pháp luật, khả năng lập trình, suy luận, tri thức và hiểu biết văn hóa – xã hội.

Thứ tư là dữ liệu phát triển AI trong các lĩnh vực thiết yếu như thủ tục hành chính, y tế, giáo dục, môi trường – khí hậu, năng lượng – tài nguyên, tài chính – kinh tế, bản đồ số và hạ tầng viễn thông.

Thứ năm là dữ liệu phục vụ đánh giá an toàn, tin cậy của AI, gồm dữ liệu phát hiện tin giả, nhận diện sản phẩm do AI tạo ra, các kịch bản kiểm thử đạo đức AI, phát hiện mã độc và nguy cơ an ninh mạng.

Đây là cơ sở để hoàn thiện các kho dữ liệu lớn (Big Data), hồ dữ liệu (Data Lake) trong các lĩnh vực thiết yếu, hình thành nền tảng dữ liệu đủ mạnh để thúc đẩy nghiên cứu, phát triển và ứng dụng AI. Phấn đấu đến năm 2030, 100% cơ sở dữ liệu ưu tiên được số hóa, chuẩn hóa và tích hợp vào Cơ sở dữ liệu tổng hợp quốc gia, đồng thời làm chủ các mô hình ngôn ngữ lớn tiếng Việt và các thuật toán AI cốt lõi phù hợp với đặc thù Việt Nam.

ỦY BAN NHÂN DÂN TỈNH THÁI NGUYÊN

SỞ TÀI CHÍNH

TRUNG TÂM TƯ VẤN VÀ XÚC TIẾN ĐẦU TƯ

Số 16a, đường Nha Trang, thành phố Thái Nguyên, tỉnh Thái Nguyên

Ghi rõ nguồn "www.thainguyeninvest.vn" hoặc "www.thainguyendautu.vn" khi phát hành lại thông tin từ website này