Quy trình phân tích dữ liệu với ChatGPT hoàn chỉnh:
1. Xác định mục tiêu phân tích
2. Thu thập dữ liệu
3. Làm sạch dữ liệu (Data Cleaning)
4. Phân tích khám phá (Exploratory Data Analysis - EDA)
5. Phân tích nâng cao
6. Xuất báo cáo
Có một điều mà gần như không ai nói với bạn: rất nhiều báo cáo phân tích dữ liệu trong các doanh nghiệp hiện nay không hoàn toàn do con người viết. Linh không nói về những chuyên gia BI hay các nhóm phân tích dữ liệu chuyên nghiệp. Linh đang nói đến những bản báo cáo mà bạn từng nghĩ phải dùng Excel nâng cao, Python hay Power BI mới làm được. Sự thật là, hiện tại, với ChatGPT, bạn hoàn toàn có thể phân tích dữ liệu từ con số 0. Ngay cả khi bạn không biết viết các hàm Excel hay chưa từng đụng đến một dòng code.
Trong bài viết này, Linh sẽ chia sẻ quy trình phân tích dữ liệu với AI dành cho người mới bắt đầu, kèm thực hành dễ hiểu. Linh tin rằng sau khi nắm được quy trình này, bạn sẽ không còn nhìn dữ liệu với ánh mắt sợ hãi nữa.
Thông thường, quy trình phân tích dữ liệu theo cách truyền thống sẽ gồm sáu bước chính. Đầu tiên là xác định rõ mục tiêu phân tích, sau đó bạn phải lấy dữ liệu từ hệ thống, thường là từ phần mềm quản lý, CRM, hoặc các công cụ lưu trữ khác. Bước tiếp theo là làm sạch dữ liệu, tức là xử lý các lỗi sai, định dạng không đồng nhất, hoặc dữ liệu bị trùng. Khi dữ liệu đã ổn, bạn sẽ thực hiện phân tích bằng Excel hoặc viết mã bằng Python nếu cần tính toán nâng cao. Nếu muốn phân tích sâu hơn, bạn sẽ áp dụng các thuật toán, chẳng hạn như phân nhóm khách hàng, dự đoán xu hướng mua hàng. Và cuối cùng là bước trình bày kết quả, thường là tạo báo cáo hoặc slide để gửi cho người khác.
Quy trình này nghe qua thì hợp lý, nhưng để thực hiện được từ đầu đến cuối thì cần rất nhiều thời gian và kỹ năng kỹ thuật. Chính vì thế, với những ai không có nền tảng chuyên môn, việc phân tích dữ liệu theo cách này có thể khiến bạn cảm thấy choáng ngợp.
Khi chuyển sang dùng ChatGPT để phân tích dữ liệu, quy trình tổng thể vẫn giữ nguyên về mặt logic, nhưng Linh nhận thấy cách thực hiện thì khác hẳn. Mọi thứ trở nên đơn giản và thân thiện hơn rất nhiều, đặc biệt là với những bạn không rành kỹ thuật.
(1) Bước 1: Xác định mục tiêu phân tích
Thay vì viết ra một câu hỏi học thuật, bạn chỉ cần diễn đạt tự nhiên. Ví dụ: “Tôi muốn biết lý do vì sao khách hàng hay hủy đơn” hoặc “Tìm giúp tôi sản phẩm nào mang lại lợi nhuận cao nhất”. Nhiều bạn lo rằng nếu không nói đúng thuật ngữ, ChatGPT sẽ không hiểu. Nhưng thực tế, chỉ cần bạn biết mình muốn gì, bạn có thể hỏi như đang trò chuyện với một đồng nghiệp, và ChatGPT vẫn trả lời được.
Vấn đề lớn hơn nằm ở chỗ: nhiều người, kể cả kỹ sư dữ liệu, chưa rõ điều mình thực sự muốn tìm ra. Với ChatGPT, cách bạn hỏi không phải vấn đề. Quan trọng là bạn phải biết mình cần hỏi gì. ChatGPT thậm chí có thể giúp bạn đặt câu hỏi: chỉ cần sao chép tiêu đề các cột dữ liệu, dán vào cửa sổ chat và yêu cầu gợi ý câu hỏi theo từng nhóm chủ đề. Sau đó, bạn chỉ cần chọn ra những câu hỏi mình muốn đào sâu.
(2) Bước 2: Đưa dữ liệu vào
Với cách truyền thống, bạn phải biết cách trích xuất dữ liệu hoặc xử lý file Excel bằng công cụ chuyên dụng. Nhưng với ChatGPT, bạn chỉ cần tải file lên hoặc mô tả dữ liệu. ChatGPT sẽ đọc, đánh giá dữ liệu, cho bạn biết có phù hợp để phân tích không, và nếu thiếu thì cần bổ sung gì.
(3) Bước 3: Làm sạch dữ liệu
Thay vì viết hàm hay chỉnh thủ công, bạn chỉ cần viết prompt như: “Cột ngày tháng đang có nhiều định dạng, hãy chuẩn hoá giúp tôi theo dạng MM/DD/YY” hoặc “Giúp tôi xoá các dòng bị trùng”. ChatGPT sẽ xử lý nhanh chóng.
(4) Bước 4: Phân tích khám phá (Exploratory Data Analysis - EDA)
Đây là bước tìm hiểu dữ liệu nói gì. Bạn có thể hỏi: “Doanh số mỗi khu vực như thế nào?”, “Ngành nghề nào có mức lương cao nhất?” hoặc “Tháng nào bán được nhiều nhất?”. ChatGPT sẽ phân tích và tạo biểu đồ minh họa.
(5) Bước 5: Phân tích nâng cao
Nếu muốn phân nhóm khách hàng, dự đoán xu hướng, hay tìm mối liên hệ giữa các yếu tố, ChatGPT cũng có thể giúp bạn. Nó đưa ra gợi ý, tạo dòng lệnh mẫu, hoặc giải thích đơn giản để bạn hiểu.
(6) Bước 6: Trình bày kết quả
Với cách truyền thống, phần diễn giải thường khô khan. Nhưng với ChatGPT, bạn có thể nhờ viết lại dễ hiểu, tùy đối tượng người đọc như sếp, khách hàng, hay người không chuyên. Đây chính là phần quan trọng nhất để người khác hiểu và đồng ý với bạn. Cuối cùng, ChatGPT còn có thể giúp bạn tạo báo cáo: slide, PDF, hoặc bản tóm tắt chuyên nghiệp.
Để bạn hình dung rõ hơn, Linh đã chuẩn bị một file dữ liệu mẫu mang tên “AI Job Dataset”. Đây là bảng thống kê việc làm trong ngành AI trên toàn cầu, bao gồm mức lương, vị trí công việc, kỹ năng yêu cầu, và nhiều yếu tố liên quan. File này phản ánh rất sát những loại dữ liệu thường gặp trong phân tích nhân sự, tuyển dụng hoặc nghiên cứu thị trường lao động.
Bạn có thể tải file thực hành mẫu tại đây.
(1) Xác định mục tiêu phân tích
Trước tiên, hãy nhập câu lệnh thông báo cho ChatGPT về toàn bộ quy trình phân tích dữ liệu với 6 bước.
Nhấp vào xem Prompt
Quy trình phân tích dữ liệu với ChatGPT hoàn chỉnh:
1. Xác định mục tiêu phân tích
2. Thu thập dữ liệu
3. Làm sạch dữ liệu (Data Cleaning)
4. Phân tích khám phá (Exploratory Data Analysis - EDA)
5. Phân tích nâng cao
6. Xuất báo cáo
Sau đó, tải file lên kèm yêu cầu “Thực hiện bước 1 với dữ liệu nhận được”. ChatGPT sẽ gợi ý mục tiêu phân tích, như: xu hướng nghề nghiệp liên quan đến AI, kỹ năng được yêu cầu nhiều nhất, hoặc so sánh lương giữa các quốc gia. Ví dụ, Linh chọn tìm hiểu xu hướng nghề nghiệp và kỹ năng AI được tuyển nhiều nhất. Như vậy là xong bước 1, đặt câu hỏi rõ ràng và xác định trọng tâm phân tích.
ChatGPT gợi ý mục tiêu phân tích
(2) Xem dữ liệu và làm sạch sơ bộ
Ngay sau đó, ChatGPT cũng tiến hành kiểm tra nhanh cấu trúc của file dữ liệu được cung cấp. Bộ dữ liệu gồm 15.000 dòng, 19 cột. Các dữ liệu này được đánh giá là sạch, không có giá trị dư, thiếu, hay trùng lặp. Các cột thông tin bao gồm tên công việc, lương, quốc gia, kỹ năng yêu cầu, trình độ học vấn, số năm kinh nghiệm, loại hình làm việc. Đây là bước 2 và 3 của quy trình phân tích: kiểm tra cấu trúc và làm sạch sơ bộ. Vì dữ liệu đã sạch nên không cần xử lý thêm, có thể chuyển sang bước tiếp theo là phân tích khám phá.
ChatGPT tiến hành kiểm tra nhanh cấu trúc của file dữ liệu
Trong bài viết hôm nay, Linh đã chọn bộ dữ liệu đã được làm sạch sẵn. Nhưng trong thực tế, phần này không dễ. Mặc dù việc làm sạch dữ liệu đang trở nên dễ dàng hơn nhờ AI, bạn vẫn cần một quy trình bài bản để biến bảng dữ liệu thô thành hành động thực tế.
Linh và Skills Bridge đã xây dựng chương trình Data Bootcamp để giúp bạn làm điều đó. Trọn bộ gồm hai khóa học: Data Processing và AI for Decision Making được thiết kế để giúp bạn: (1) hiểu bản chất của dữ liệu, (2) xây được quy trình thu thập, làm sạch, phân tích dữ liệu chuẩn, và (3) quan trọng nhất là biết cách dùng AI như một công cụ hỗ trợ ra quyết định dựa trên dữ liệu nhanh và chính xác hơn.
Đây là một khoản đầu tư rất đáng giá. Hãy đăng ký ngay dưới phần mô tả và bình luận của video để được giảm giá đến gần 50% nha.
(3) Phân tích nhanh: Insight cơ bản
Trở lại với bước tiếp theo là Phân tích nhanh. Dựa trên mục tiêu phân tích mà Linh đã chọn ở bước 1, ChatGPT bắt đầu bằng việc thống kê tần suất xuất hiện của các vị trí công việc khác nhau để tìm ra top 10 công việc AI phổ biến nhất ở cả biểu đồ và dạng bảng.
ChatGPT trực quan hóa top 10 công việc AI phổ biến nhất
Song song đó, ChatGPT cũng phân tích tần suất của các kỹ năng được yêu cầu nhiều nhất trong cột “required_skills” bằng cách tách từng kỹ năng ra và đếm số lần xuất hiện.
ChatGPT tổng hợp Top 15 kỹ năng được yêu cầu nhiều nhất
Từ đây, ta thấy những công việc như Machine Learning Researcher, AI Software Engineer, Autonomous Systems Engineer nằm trong top đầu, trong khi Python, SQL, TensorFlow và Kubernetes là những kỹ năng được tuyển dụng nhiều nhất. Đây là các insight đơn giản, nhưng cực kỳ thực tiễn với người làm nhân sự hoặc những ai đang định hướng nghề nghiệp trong lĩnh vực AI.
(4) Phân tích khám phá toàn diện (EDA)
Sau khi đã có được những góc nhìn ban đầu từ các biểu đồ và bảng thống kê đơn giản, Linh tiếp tục yêu cầu ChatGPT thực hiện một phân tích khám phá toàn diện, còn gọi là Exploratory Data Analysis, hay EDA. Đây là một bước rất quan trọng trong phân tích dữ liệu, giúp hiểu rõ toàn bộ cấu trúc dữ liệu từ nhiều khía cạnh trước khi đi sâu hơn.
Lúc này, ChatGPT không chỉ nhìn vào vài cột riêng lẻ mà tổng hợp cả các biến số (như lương, năm kinh nghiệm, điểm phúc lợi, độ dài mô tả công việc) lẫn biến phân loại (như tên công việc, quốc gia, ngành nghề, hình thức làm việc, trình độ học vấn).
ChatGPT tổng hợp cả các biến số lẫn biến phân loại
Với các biến số, ChatGPT đưa ra bảng thống kê mô tả bao gồm giá trị trung bình, min, max, độ lệch chuẩn, để giúp người đọc hình dung được mức độ phân tán của dữ liệu. Ví dụ, lương trung bình là khoảng 115.000 USD, nhưng dao động rất lớn từ 32.000 đến gần 400.000 USD, chứng tỏ sự chênh lệch lớn giữa các vị trí công việc hoặc khu vực. Tương tự, số năm kinh nghiệm trung bình là hơn 6 năm, nhưng có những vị trí yêu cầu tới 19 năm, trong khi một số khác không yêu cầu kinh nghiệm nào.
Còn với biến phân loại, ChatGPT liệt kê số lượng giá trị khác nhau trong mỗi cột, đồng thời thống kê top 5 giá trị xuất hiện phổ biến nhất. Ví dụ: có 20 loại chức danh công việc khác nhau, trong đó phổ biến nhất là Machine Learning Researcher, AI Software Engineer, AI Architect. Với trình độ học vấn, 4 loại bằng cấp được yêu cầu từ Associate, Bachelor đến Master và PhD, phản ánh tính đa dạng của nhu cầu tuyển dụng trong ngành AI. Cũng nhờ phần này mà bạn có thể xác định những cột nào đáng để phân tích tiếp, cột nào có thể bỏ qua hoặc cần chuẩn hóa.
Tóm lại, phân tích khám phá EDA đã giúp bạn hình dung rõ ràng “bức tranh toàn cảnh” về bộ dữ liệu - từ cấu trúc, độ rộng, đến các phân bố cơ bản - là bước đệm lý tưởng trước khi thực hiện phân tích nâng cao hay xây dựng mô hình.
(5) Trực quan hóa và tìm mối tương quan
Tiếp theo là bước trực quan hóa. ChatGPT đã tạo các biểu đồ minh họa mối quan hệ giữa lương và các yếu tố khác như vị trí công việc, kinh nghiệm làm việc, trình độ học vấn, và làm việc từ xa. Điều thú vị là các vị trí như Head of AI hay AI Software Engineer có mức lương rất cao, nhưng mức độ dao động cũng lớn.
ChatGPT tạo biểu đồ mối quan hệ giữa lương và các yếu tố khác
Ngoài ra, công việc từ xa thường có mức lương cao hơn công việc cần lên văn phòng, và bằng cấp cao chưa chắc giúp bạn có thu nhập tốt nếu thiếu kỹ năng phù hợp. Biểu đồ cũng cho thấy có mối tương quan tích cực giữa số năm kinh nghiệm và lương, nhưng không phải lúc nào cũng tuyến tính. Nghĩa là kỹ năng vẫn là yếu tố quyết định quan trọng.
(6) Diễn giải kết quả và khuyến nghị
Sau khi đã có một loạt phân tích ở trên, ChatGPT sẽ giúp bạn tổng hợp lại thành một bản tóm tắt dễ hiểu: đâu là vị trí đang được tuyển nhiều, kỹ năng nào đang được săn đón, quốc gia nào dẫn đầu về tuyển dụng các vị trí AI, và điều gì ảnh hưởng đến lương.
ChatGPT tổng hợp lại thành một bản tóm tắt
Từ đó, ChatGPT đề xuất một số khuyến nghị cụ thể: với người tìm việc thì nên tập trung vào học các kỹ năng nền tảng như Python, đồng thời tận dụng cơ hội làm việc từ xa. Với doanh nghiệp, lời khuyên là nên mở rộng mô hình làm việc linh hoạt để thu hút nhân tài và cân nhắc đào tạo nội bộ thay vì chỉ tuyển mới.
Sau bước này, bạn đã sẵn sàng chuyển sang phần kết hợp cả 3 hướng phân tích (xu hướng, nhóm mục tiêu, mô hình dự đoán) một cách mạch lạc và có cơ sở dữ liệu vững chắc.
(7) Gộp 3 hướng phân tích nâng cao: Xu hướng - Nhóm - Dự đoán
Cuối cùng, bạn muốn đi xa hơn một chút, nhưng vẫn giữ tính đơn giản, bằng cách kết hợp ba hướng phân tích nâng cao: khám phá xu hướng, nhóm mục tiêu và xây mô hình dự đoán. ChatGPT đã viết lại toàn bộ phần này như một bài chia sẻ dành cho người không chuyên, với lối diễn đạt dễ hiểu, ví dụ cụ thể và logic rõ ràng.
ChatGPT kết hợp ba hướng phân tích nâng cao
Phần này trình bày các phát hiện thú vị về xu hướng tuyển dụng AI hiện nay, phân loại các nhóm công việc khác nhau để dễ hình dung, và dùng mô hình đơn giản để ước lượng lương theo kỹ năng và kinh nghiệm. Tất cả được gói gọn trong một nội dung dễ chia sẻ dưới dạng bài viết hay thuyết trình ngắn.
Tóm lại, chúng ta vừa cùng nhau đi qua toàn bộ quy trình phân tích dữ liệu - từ xác định mục tiêu, kiểm tra dữ liệu, phân tích khám phá, trực quan hóa, diễn giải insight, đến phân tích nâng cao. Mọi bước đều được thực hiện bằng ngôn ngữ tự nhiên, không cần viết code, rất phù hợp với người làm việc trong doanh nghiệp không chuyên về kỹ thuật. Thấy là rất thú vị, và cũng không quá khó đúng không? Bây giờ các bạn đã bớt sợ phân tích dữ liệu chút nào chưa?
Sau khi hoàn tất toàn bộ chuỗi phân tích này, Linh chỉ có một suy nghĩ: nếu từng người đi làm đều biết tận dụng dữ liệu như thế này cho chính công việc của mình, thì khoảng cách giữa "biết" và "ra quyết định" sẽ được rút ngắn nhiều đến mức nào?
Lúc này, có thể bạn chưa phải là người giỏi nhất trong team. Nhưng nếu biết hỏi, biết phân tích, biết nhìn số liệu rồi tự kết luận, bạn có thể chủ động đề xuất, dẫn dắt cuộc họp, hoặc đưa ra hướng đi sớm hơn người khác. Trong môi trường làm việc hiện đại, chỉ cần bạn hơn người khác một bước suy nghĩ là đã đủ tạo nên sự khác biệt. Và Linh tin rằng khả năng tư duy bằng dữ liệu sẽ sớm trở thành một lợi thế không thể thiếu cho bất kỳ ai muốn tiến xa trong sự nghiệp.
Bạn không cần trở thành chuyên gia dữ liệu, nhưng chắc chắn nên là người ra quyết định dựa trên dữ liệu. Chính sự chủ động đó sẽ mở ra nhiều cơ hội trong tương lai - không phải bằng may mắn, mà bằng năng lực thật sự.
Viết bởi
Đội ngũ Skills Bridge
Skills Bridge là nơi cung cấp cho bạn (1) tin tức mới nhất, (2) kiến thức nền tảng và (3) cách ứng dụng AI để nâng cao hiệu suất công việc. Bạn cũng có thể tìm hiểu và tham khảo các khóa học chuyên sâu về AI do Skills Bridge thiết kế lộ trình tại đây.
AI Productivity X10 Hiệu Suất
Doanh Nghiệp Với AI
Đào tạo kỹ năng làm việc văn phòng và kinh doanh
cho khách hàng cá nhân và doanh nghiệp.
Liên hệ
Skills Bridge cung cấp các chương trình đào tạo giúp cả khách hàng cá nhân và doanh nghiệp nâng cao kỹ năng chuyên môn, kỹ năng lãnh đạo và xây dựng doanh nghiệp thành công.
Liên hệ
Skills Bridge cung cấp các chương trình đào tạo giúp cả khách hàng cá nhân và doanh nghiệp nâng cao kỹ năng chuyên môn, kỹ năng lãnh đạo và xây dựng doanh nghiệp thành công.
Liên hệ