Dữ liệu số trong Công nghiệp Công nghệ số: Nguồn tài nguyên và khuôn khổ chất lượng mới

14:40:41 | 4/11/2025

Trong kỷ nguyên Cách mạng công nghiệp 4.0, dữ liệu đã trở thành “nguyên liệu thô” chiến lược, vượt xa vai trò thông tin đơn thuần. Quy mô thị trường dữ liệu và phân tích toàn cầu đã vượt 300 tỷ USD năm 2024 và được dự báo chạm mốc 1.000 tỷ USD vào đầu thập niên 2030. Với mục tiêu kinh tế số chiếm 20% GDP vào năm 2025, Việt Nam coi dữ liệu là huyết mạch của ngành công nghiệp công nghệ số. Trong bối cảnh Luật Công nghiệp Công nghệ số đã hình thành, yêu cầu đặt ra là tối ưu hóa giá trị và bảo đảm chất lượng cho nguồn tài nguyên vô tận này.


 Trung tâm dữ liệu - hạ tầng cốt lõi của nền công nghiệp công nghệ số, nơi lưu trữ và xử lý khối lượng dữ liệu khổng lồ phục vụ chuyển đổi số quốc gia.

Dữ liệu: "Nguyên liệu" và "Sản phẩm" của nền kinh tế số

Trong mô hình công nghiệp truyền thống, nhà máy cần than, thép, và năng lượng để tạo ra sản phẩm. Trong công nghiệp CNS, các doanh nghiệp "tiêu thụ" dữ liệu. Dữ liệu là nguyên liệu thô để huấn luyện các mô hình trí tuệ nhân tạo (AI), là cơ sở để thực hiện các phân tích kinh doanh (Business Intelligence), và là nền tảng để cá nhân hóa trải nghiệm người dùng. Một ứng dụng di động, một nền tảng thương mại điện tử, hay một giải pháp điện toán đám mây... tất cả đều không thể vận hành hiệu quả nếu thiếu đi dòng chảy dữ liệu đầu vào.

Tuy nhiên, điểm khác biệt cốt lõi nằm ở chỗ, chính quá trình "tiêu thụ" nguyên liệu này lại đồng thời "sản xuất" ra một lượng dữ liệu mới, thậm chí còn lớn hơn. Khi một người dùng tương tác với một dịch vụ công nghệ số, họ đang tạo ra dữ liệu: lịch sử tìm kiếm, nhật ký truy cập, thói quen tiêu dùng, dữ liệu cảm biến từ thiết bị... Những dữ liệu "thải" ra từ hoạt động này ngay lập tức lại trở thành "nguyên liệu" cho chu kỳ phát triển sản phẩm tiếp theo.

Đây chính là vòng lặp tạo nên "nguồn tài nguyên vô tận" mà ngành công nghiệp CNS đang khai thác. Dữ liệu không bị mất đi hay tiêu hao sau khi sử dụng; nó được làm giàu, tái cấu trúc và tái sử dụng. Một mẩu dữ liệu về hành vi người dùng có thể được dùng để cải thiện thuật toán gợi ý sản phẩm, tối ưu hóa giao diện người dùng, và dự đoán xu hướng thị trường. Vòng lặp "Nguyên liệu -> Sản phẩm (tạo ra Dữ liệu mới) -> Nguyên liệu mới" này là động cơ tăng trưởng vĩnh cửu của kinh tế số.

Chất lượng sản phẩm công nghệ số phụ thuộc vào chất lượng dữ liệu

Khi dữ liệu trở thành tài sản và nguyên liệu cốt lõi, chất lượng của nó trở thành yếu tố sống còn, quyết định trực tiếp đến chất lượng của sản phẩm và dịch vụ CNS. Nguyên tắc "Rác vào - Rác ra" (Garbage In, Garbage Out - GIGO) đặc biệt đúng trong lĩnh vực này.

Một mô hình AI được huấn luyện bằng dữ liệu thiếu chính xác, thiên vị hoặc không đầy đủ sẽ đưa ra những quyết định sai lệch, thậm chí gây hại. Một hệ thống phân tích kinh doanh dựa trên dữ liệu "bẩn" (dirty data) sẽ dẫn đến những chiến lược kinh doanh sai lầm. Một dịch vụ cá nhân hóa nếu dựa trên dữ liệu lỗi thời sẽ mang lại trải nghiệm tồi tệ cho người dùng.

Do đó, việc nâng cao chất lượng sản phẩm và dịch vụ công nghệ số phải bắt đầu từ việc đảm bảo chất lượng dữ liệu. Dữ liệu tốt không chỉ cần chính xác và phản ánh đúng thực tế, mà còn phải đầy đủ, không bỏ sót những thông tin quan trọng phục vụ cho phân tích và ra quyết định. Bên cạnh đó, dữ liệu cần được duy trì tính nhất quán giữa các hệ thống và trong suốt vòng đời sử dụng, đồng thời được cập nhật kịp thời để phản ánh đúng tình trạng hiện tại. Một yếu tố không kém phần quan trọng là tính hợp lệ, tức dữ liệu phải tuân thủ các chuẩn định dạng và quy tắc đã được thiết lập. Chỉ khi đảm bảo được những yếu tố này, dữ liệu mới thực sự trở thành nền tảng tin cậy cho phát triển công nghệ số bền vững và hiệu quả.

Để đảm bảo chất lượng, các doanh nghiệp CNS cần đầu tư vào các quy trình quản trị dữ liệu (Data Governance) nghiêm ngặt, bao gồm các khâu thu thập, làm sạch, gán nhãn, lưu trữ và kiểm toán dữ liệu.

Thúc đẩy chất lượng và quản trị dữ liệu trong khuôn khổ pháp lý mới

Hiện nay, khi nói đến pháp luật về dữ liệu, trọng tâm thường dồn về bảo vệ dữ liệu cá nhân (ví dụ như Nghị định 13/2023/NĐ-CP của Việt Nam hay GDPR của Châu Âu). Đây là một trụ cột cực kỳ quan trọng, nhưng nó chưa bao phủ toàn bộ bức tranh dữ liệu trong ngành công nghiệp CNS.

Ngành công nghiệp CNS không chỉ xử lý dữ liệu cá nhân. Nó còn tạo ra và xử lý một khối lượng khổng lồ "dữ liệu công nghiệp" hay "dữ liệu phi cá nhân". Khái niệm này, được làm rõ tại Khoản 6, Điều 4 của Luật Công nghiệp Công nghệ số, bao gồm các loại dữ liệu như dữ liệu vận hành máy móc, dữ liệu cảm biến IoT trong nhà máy thông minh, dữ liệu nhật ký hệ thống, hoặc các bộ dữ liệu đã được ẩn danh hóa hoàn toàn.

Nhận thức rõ tầm quan trọng của dữ liệu như một loại tài nguyên chiến lược, Luật Công nghiệp công nghệ số (CNS) đã dành riêng các quy định tại Điều 26 và Điều 27 để quản lý, phát triển và khai thác hiệu quả nguồn dữ liệu công nghiệp. Đây là nền tảng pháp lý quan trọng nhằm cụ thể hóa yêu cầu về chất lượng và đổi mới trong phát triển hạ tầng dữ liệu quốc gia.

Trước hết, việc quản trị dữ liệu (data governance) được đặt ở vị trí trung tâm. Pháp luật không chỉ dừng lại ở việc bảo vệ dữ liệu cá nhân, mà còn hướng tới yêu cầu các tổ chức công nghiệp công nghệ số phải xây dựng hệ thống quản trị dữ liệu nội bộ bài bản bao gồm phân loại, quản lý vòng đời và xác định rõ trách nhiệm giải trình đối với chất lượng cũng như an toàn dữ liệu.

Song song với đó, tiêu chuẩn hóa và khả năng tương tác giữa các hệ thống được coi là yếu tố then chốt. Khi dữ liệu từ các doanh nghiệp khác nhau có thể liên thông, chia sẻ và “nói chuyện” với nhau thông qua các chuẩn định dạng và giao thức an toàn, giá trị tổng hợp của toàn ngành sẽ tăng lên đáng kể, mở đường cho việc hình thành các hệ sinh thái dữ liệu lớn và nền tảng AI dùng chung.

Cùng với việc xây dựng hệ thống chia sẻ dữ liệu, Luật cũng chú trọng bảo vệ tài sản dữ liệu của doanh nghiệp, coi đây là một dạng tài sản trí tuệ có giá trị tương tự như công nghệ hay sáng chế. Các quy định về an toàn thông tin, an ninh mạng cần được mở rộng để bảo vệ những kho dữ liệu chiến lược khỏi nguy cơ tấn công và đánh cắp.

Cuối cùng, việc bảo đảm chất lượng dữ liệu trở thành yêu cầu thiết yếu. Trong những lĩnh vực nhạy cảm như y tế, tài chính hay hạ tầng, dữ liệu đầu vào cho các mô hình AI cần được kiểm toán và đánh giá về độ chính xác, tính đại diện và khả năng tránh thiên vị. Chỉ khi dữ liệu được quản trị, tiêu chuẩn hóa, bảo mật và đảm bảo chất lượng đồng bộ, nó mới thực sự trở thành nền tảng thúc đẩy đổi mới sáng tạo và phát triển bền vững trong ngành công nghiệp công nghệ số.

Tích hợp, không trùng lặp

Điều quan trọng là các quy định chi tiết hóa về dữ liệu công nghiệp (trong khuôn khổ Luật CNS) phải được thiết kế để "tích hợp" chứ không phải "trùng lặp" với các khuôn khổ pháp lý hiện có.

Một doanh nghiệp CNS khi xử lý dữ liệu phải tuân thủ đồng thời nhiều lớp quy định. Lớp cơ bản và bắt buộc đầu tiên là pháp luật về dữ liệu cá nhân, pháp luật về dữ liệu khi họ thu thập thông tin người dùng. Sau khi dữ liệu đó đã được ẩn danh, tổng hợp, nó trở thành một phần của "tài sản dữ liệu công nghiệp". Lúc này, các quy định về quản trị, chất lượng, tiêu chuẩn hóa và an toàn dữ liệu công nghiệp sẽ được áp dụng. Hai hệ thống pháp luật này bổ trợ cho nhau: một hệ thống bảo vệ quyền riêng tư của cá nhân, hệ thống còn lại bảo vệ và nâng cao giá trị của tài sản chiến lược quốc gia là dữ liệu.

Dữ liệu là nguồn tài nguyên vô tận, là động lực cốt lõi cho sự phát triển của ngành công nghiệp công nghệ số. Nhận thức rằng chất lượng sản phẩm công nghệ số gắn liền với chất lượng dữ liệu là bước đầu tiên và quan trọng nhất. Để Việt Nam có thể khai thác tối đa tiềm năng của nguồn tài nguyên này, việc triển khai hiệu quả hành lang pháp lý (như Luật Công nghiệp Công nghệ số) và xây dựng các tiêu chuẩn cụ thể cho dữ liệu công nghiệp là nhiệm vụ trọng tâm. Một khung pháp lý không chỉ tập trung vào bảo vệ, mà còn thúc đẩy quản trị, nâng cao chất lượng, và khuyến khích chia sẻ dữ liệu một cách an toàn, sẽ là bệ phóng vững chắc cho các doanh nghiệp công nghệ số Việt Nam vươn ra biển lớn.

Nguồn: Vietnam Business Forum