Small Data là một loại dữ liệu đang ngày càng được quan tâm nhiều hơn, nhất là khi nói đến việc phân tích dữ liệu người dùng ở môi trường doanh nghiệp vừa và nhỏ.
1. Small Data - Dữ liệu nhỏ là gì?
Small Data được hiểu theo nghĩa tiếng Việt là dữ liệu nhỏ, là một tập Data dựa trên môi trường xử lý CSDL quan hệ giống như MySQL, SQL Server, Oracle, DB2,...
Small Data -Dữ liệu nhỏ mô tả dữ liệu sử dụng dựa trên thu thập dữ liệu mục tiêu và khai thác dữ liệu. Nó mô tả một sự thay đổi trong cách các doanh nghiệp và các bên khác nhìn vào sử dụng dữ liệu, và được thiết kế để trở thành một đối trọng với xu hướng dữ liệu lớn. Dữ liệu nhỏ đủ để con người sử dụng phục vụ cho nhu cầu tìm hiểu thông tin của mình trong một khối lượng ít, cấu trúc của nó có thể dễ dàng truy cập được, ngắn gọn nhưng khả thi.
2. So sánh Small Data và Big Data
3. Small Data trong tìm kiếm Insight khách hàng
Trong khi dữ liệu lớn (Big Data) tập trung vào khối lượng thông tin khổng lồ mà các cá nhân và người tiêu dùng đã tạo ra để sau đó doanh nghiệp sử dụng AI để sàng lọc, dữ liệu nhỏ (Small Data) được tạo thành từ các khối thông tin có kích thước nhỏ, dễ tiếp cận hơn, điều mà doanh nghiệp có thể chuyển tải nhanh nó thành các insights có thể hành động được.
Trong khi dữ liệu lớn có thể là trở ngại đối với các doanh nghiệp vừa và nhỏ do tính chất phi cấu trúc của nó cũng như yêu cầu một khối lượng lớn không gian lưu trữ cần thiết, dữ liệu nhỏ có nhiều sức hấp dẫn ở chỗ nó có thể sẵn sàng được sử dụng ngay mà không cần qua quá nhiều bước xử lý phức tạp.
Tuy nhiên, vì dữ liệu nhỏ thường được lưu trữ trong một công ty, điều cần thiết là các doanh nghiệp phải sử dụng các cấp độ an ninh mạng thích hợp để bảo vệ quyền riêng tư của khách hàng và giữ an toàn cho dữ liệu của họ.
4. Xu hướng sử dụng Small Data và nguy cơ tiềm ẩn
Theo các nhà phân tích của Gartner, có tới 70% doanh nghiệp sẽ chuyển trọng tâm từ dữ liệu lớn sang dữ liệu nhỏ và rộng vào năm 2025.
Cũng giống như dữ liệu nhỏ, dữ liệu rộng (wide data) dựa vào việc các doanh nghiệp liên kết các dữ liệu được tạo ra từ nhiều nguồn khác nhau như lưu lượng truy cập website, lượt ghé qua cửa hàng (offline), các tương tác trên mạng xã hội hay các yêu cầu tư vấn qua điện thoại.
Vì các dữ liệu nhỏ được lưu trữ tập trung (tại doanh nghiệp) nên nó có thể dễ bị tin tặc đánh cắp hơn – trong khi dữ liệu lớn được lưu trữ trên các máy chủ bên ngoài.
Do quy mô dữ liệu bạn đang thu thập là tương đối nhỏ và cụ thể, bạn có thể sử dụng chúng để trả lời các câu hỏi cụ thể hoặc giải quyết các vấn đề mới nảy sinh trong doanh nghiệp.
Lưu trữ dữ liệu trực tuyến có thể bao gồm bất kỳ thứ gì từ dữ liệu bán hàng, lượt truy cập website, báo cáo hàng tồn kho, dự báo thời tiết, cảnh báo sử dụng hay bất kỳ thứ gì con người có thể truy cập và dễ dàng tìm nạp (lấy dữ liệu về).