Power Query xuất hiện lần đầu tiên dưới dạng phần mở rộng (Addin) cho Excel 2010, Excel 2013 và đã trở thành 1 phần của Excel trong phiên bản Excel 2016 trong thẻ Data dưới tên gọi Get and Transform. Tuy vậy Power Query vẫn chưa được quan tâm và tìm hiểu đủ. Rất nhiều thao tác phức tạp trước đây bạn xử lý bằng công thức Excel hoặc lập trình VBA có thể được thay thế bởi Power Query với chỉ một vài nút bấm.
Power Query là một công cụ tối cần thiết nên có trong tool set của bạn đặc biệt là khi bạn làm việc với dữ liệu và giải quyết những vấn đề khó trong data analysis:
- Power Query mang đến cho bạn công cụ xử lý dữ liệu dễ sử dụng, có tính thống nhất và linh hoạt cho việc khám phá dữ liệu, hợp nhất dữ liệu, trích lọc dữ liệu từ nhiều nguồn khác nhau trong đó cần kể đến là: hệ cơ sở dữ liệu có cấu trúc (SQL), N0SQL, OData, các files Excel rời rạc, dữ liệu từ các trang Web, Hadooop, các files text (CSV, TSV, …), các API (Application Programming Interface) …
- Power Query có thể sử dụng để thay thế cho các công thức Excel hoặc code VBA phức tạp để xử lý dữ liệu chỉ với một vài thao tác click chuột.
- Xử lý dữ liệu ở định dạng phức tạp nếu dùng công thức Excel hoặc lập trình VBA thì rất mất công sức mới có thể giải quyết được (Ví dụ: unpivot dữ liệu)
- Load và xử lý, chuyển đổi dữ liệu từ những hệ thống MES (Manufacturing Execution System), ERP (Enterprise Resources Planning)
- Load dữ liệu và lên lịch làm mới dữ liệu từ các trang Web, API thông tin chứng khoán và nhiều thông tin khác.
Và điều thú vị ở đây: đó chỉ là một số ít ví dụ về những việc mà Power Query có thể giúp bạn trong công việc.
Quan trọng hơn nữa, trước khi bắt đầu với Power BI để tạo ra được những báo cáo, những đồ thị trực quan thì việc xử lý dữ liệu, làm sạch dữ liệu, transform dữ liệu có thể lên tới 80% công sức và thời gian của bạn. Dữ liệu được làm sạch, ở định dạng phù hợp, các quan hệ giữa các queries được định nghĩa hợp lý sẽ giúp việc tạo ra báo cáo trong Power BI hoặc Pivot Table một cách dễ dàng, linh hoạt và tiết kiệm thời gian hơn nhiều lần.
Yêu cầu khi tham gia khoá học
- Khoá học được thiết kế cho học viên sử dụng Excel phiên bản Windows (Hiện tại Power Query chưa hỗ trợ hệ điều hành MacOS, nếu bạn sử dụng MacOS, hãy liên hệ để được tư vấn thêm)
- Máy tính của bạn cần cài sẵn ít nhất Excel 2010 trở lên, nhưng tốt nhất bạn nên sử dụng Excel 2016 trở lên (Hướng dẫn cài đặt Power Query được cung cấp ở trong khoá học)
- Kiến thức cơ bản về Excel, công thức Excel, giao diện của Excel
Khoá học này phù hợp cho những học viên
- Đang sử dụng Excel để gộp dữ liệu từ nhiều nguồn một cách thủ công, mất nhiều thời gian, dễ sai thiếu
- Đang sử dụng code VBA để gộp dữ liệu nhưng gặp khó khăn khi phải chỉnh sửa code VBA mất thời gian khi yêu cầu thay đổi, code VBA khó bảo trì nếu không có documentation rõ ràng, code VBA có thể bị chặn trong 1 số trường hợp.
- Đang làm việc với dữ liệu tương đối lớn, vượt qua khả năng lưu trữ trên 1 sheet của Excel (khoảng 1 triệu dòng)
- Muốn bổ sung thêm kiến thức vào bộ công cụ làm việc của mình để làm việc hiệu quả hơn, năng suất tốt hơn
- Muốn chuẩn bị kỹ năng về xử lý, transform, shaping dữ liệu để chuẩn bị cho việc học Power BI
- Sẵn sàng học kiến thức mới để hoàn thiện kỹ năng
Chương trình học
- Cơ bản về các thành phần giao diện trên Power Query Editor, các thao tác làm việc với Power Query
- Import dữ liệu từ nhiều nguồn, xử lý query khi nguồn dữ liệu bị thay đổi
- Text Transformation cơ bản, các kỹ thuật xử lý text với ký tự ngăn cách (Delimiter)
- Sử dụng tham số với query và các kỹ thuật tổng hợp dữ liệu, nhóm dữ liệu, tách dữ liệu
- Xử lý dữ liệu dạng ngày tháng, giờ
- M Code cơ bản
- Lấy dữ liệu từ các nguồn online, qua API
- Các kỹ thuật merge, join dữ liệu từ nhiều nguồn