[Sharing]
HỌC DATA SCIENCE NHƯ THẾ NÀO?
#datascience
Helu mấy em, dạo này có rất nhiều bạn sinh viên hỏi chị về định hướng theo 1 ngành siêu hot là Data Science đấy! Vậy ngồi xuống đây đọc một bài viết hay về nghề Data Science nhé. Đây là ngành nghề được dự đoán sẽ có nhu cầu cao nhất trong tương lai đó. Bài viết này sẽ đưa ra các bước và nguồn cho các bạn muốn học Data Science đó, đọc xem và share cho các bạn còn loay hoay nha!
___________________________________
I. Học lập trình:
Một Data Scientist (DStist) không thể không biết lập trình, dù không cần thiết phải giỏi như một lập trình viên nhưng phải đủ khả năng viết được những chương trình cơ bản. Từ khi nhập học tới giờ, từ một đứa mà kiến thức lập trình là con số 0 tròn trình, mình đã học qua R, Java, Python, SQL (kì tới sẽ có cả NoSQL nữa). Học tới đâu là sử dụng luôn tới đấy nên thường mình phải tự học thêm rất nhiều để có thể hiểu được logic và cú pháp của ngôn ngữ lập trình đó. Ngôn ngữ quan trọng nhất, phổ biến nhất dành cho DStist là Python với thư viện khổng lồ. Xếp sau Python là R, rất mạnh về phân tích thống kê. Năm ngoái mình được Khoa Toán thuê viết một App (ShinyApp) tương tác dành cho một dự án nghiên cứu của Bang sử dụng ngôn ngữ này.
Vậy học lập trình ở đâu?
https://www.tutorialspoint.com/
Trang này thì gi gỉ gì gi cái gì cũng có, thích học gì có ngay cái đó. Còn nhớ năm ngoái mình cực kỳ đuối khi các thầy bắt học thêm Java, với lý do rằng DStist thường hay phải làm việc trực tiếp với lập trình viên, vậy thì phải học để có thể trò chuyện với nhau được. Mình đã phải đọc thêm sách, đi học thêm phụ đạo, rồi lại đọc mòn mỏi trên trang này để theo kịp các bạn trên lớp. Kết quả là cuối kì, mình tự viết được cả trò chơi và thậm chí còn lập trình được công thức toán thống kê cho thư viện Java đấy.
2. https://codingbat.com/
Đây là nơi mình luyện viết code, từ những ứng dụng đơn giản nhất chỉ vài ba dòng. Trình độ của mình đã lên rất nhanh sau khi hoàn thành phân nửa số bài tập trên này.
3. https://www.datacamp.com/
Mình chưa sử dụng trang này bao giờ, nhưng được quảng cáo khá nhiều. Trên này có các khóa học miễn phí R và Python thiết kế riêng cho DS. Thích hợp cho những ai mới bắt đầu.
4. https://www.udemy.com/.../development/programming-languages/
5. https://www.codecademy.com/catalog/subject/all
Đây là hai trang do bạn bè mình giới thiệu. Có mấy bạn không đi học phụ đạo Java được đã trả tiền theo học trên này. Vì thường xuyên có giảm giá sâu nên khóa học không quá đắt đỏ. Và điểm lợi thế là sẽ có chứng nhận cuối khóa, có thể củng cố thêm cho hồ sơ xin học hoặc xin việc của bạn.
II. Học thống kê:
Đã làm việc với dữ liệu là phải hiểu lý thuyết thống kê, chí ít cũng phải biết tới những khái niệm cơ bản như lấy mẫu (sampling), trung bình (mean), trung vị (median), độ lệch chuẩn (standard deviation), hồi quy tuyến tính (linear regression),... Nếu muốn trở thành DStist thì còn phải biết tới kiến thức thống kê nâng cao, liên quan tới machine learning. Một điều tuyệt vời là những cuốn sách thống kê hay ho nhất, tổng hợp nhất lại miễn phí, nhằm đáp ứng nhu cầu học tập về dữ liệu ngày càng cao. Hai cuốn sách mà tất cả các giáo sư Khoa Toán của mình đều sử dụng là:
The Elements of Statistical Learning (Trevor Hastie, Robert Tibshirani, Jerome H. Friedman, 2001)
Cuốn này hơn 700 trang, chia làm 18 chương, sử dụng R trong phân tích thống kê. Bản thân mình thấy sách quá hay, minh họa đầy đủ, giải thích kĩ càng, đọc tới đâu có thể copy code đến đấy để tự thử nghiệm. Dĩ nhiên bạn không cần phải đọc hết sách. Đụng tới khái niệm thống kê nào thì tra cứu tương ứng trong sách cũng được.
https://web.stanford.edu/~hastie/Papers/ESLII.pdf
2. An Introduction to Statistical Learning: With Applications in R ( Trevor Hastie, Robert Tibshirani, Daniela Witten, Gareth James, 2013)
Cuốn này cũng hay, hơn 400 trang, chia làm 10 chương, cũng dùng R. Ai ngại đọc cuốn trên thì có thể bắt đầu với cuốn này.
https://www-bcf.usc.edu/.../ISL/ISLR%20First%20Printing.pdf
III. Học Data Science - Nâng cao:
Sau khi có chút kiến thức cơ bản về lập trình và thống kê rồi thì bạn có thể sử dụng các trang sau để tìm hiểu thêm về các mảng chính của DS như artificial intelligence, computer vision, machine learning, Big Data Analytics, Business Intelligence...
https://towardsdatascience.com/
Đây là trang tổng hợp cực kì nhiều bài viết chất lượng từ các giáo sư và chuyên gia trong ngành. Có rất nhiều bài hướng dẫn chi tiết từng bước cho trình độ beginner. Mình thường đọc trên trang này về machine learning và artificial intelligence (AI). Không chỉ có những phân tích rất cặn kẽ về mặt lý thuyết, nhiều bài viết còn cung cấp ví dụ minh họa và đính kèm cả code để bạn đọc tự thử nghiệm. Ví dụ bài viết sau về Deep Learning là của một giáo sư ở Barcelona, toàn bộ Code có trong Notebook trên Google Colab. Vì chạy trên Cloud nên bạn không cần cài đặt gì mà có thể lập tức chạy chương trình ngay được, cực kì phù hợp cho những ai muốn xem qua trước và không muốn mất công cài đặt này nọ.
https://towardsdatascience.com/deep-learning-for...
2. https://www.datascienceweekly.org/
Một bạn người Na Uy trên Tandem giới thiệu cho mình về trang này, bảo rằng đang tự học machine learning ở đây. Thế là mình cũng đăng ký nhận Newsletter từ mấy hôm trước. Mỗi tuần, mình nhận được một email tổng hợp các bài viết nổi bật trong ngành. Như vậy để mình luôn nắm bắt được những xu hướng mới nhất và cập nhật những tiến bộ công nghệ mới.
3. https://www.kaggle.com/
Một đồng nghiệp người Ấn Độ chỉ cho mình trang này quá hay luôn. Đây là nơi bạn học hỏi bằng cách thực hành qua các dự án, các cuộc thi và thử thách quốc tế. Các công ty, tổ chức treo giải thưởng có khi lên tới cả 100,000$ cho đội nào chiến thắng. Chẳng hạn hiện giờ có 20 cuộc thi đấu song song, và đã có hàng ngàn đội đăng kí tham gia. Trên này cũng có các micro-courses hoàn toàn miễn phí từ Python cho tới Deep Learning dành cho beginner.
https://www.kaggle.com/learn/overview
4. https://www.coursera.org/browse/data-science
Và cuối cùng, dĩ nhiên là trên coursera cũng có khóa học miễn phí dành cho DS. Khi nào có thời gian, bạn thử đăng ký xem sao.
Trên đây là những hướng dẫn chung dành cho những ai muốn tìm hiểu về Data Science và học những kĩ năng cơ bản trước. Hi vọng giúp được các bạn đang quan tâm. Mình sẽ tiếp tục cập nhật thêm nhé.
Blog Mai Knows người chị thân thiết của Founder Hoa Dinh ở Đức
https://www.facebook.com/maiknowsnow/
Link tham khảo về lương của DStist:
https://www.burtchworks.com/.../2018-data-scientist.../
----
Join các kênh khác của HannahEd:
- Job Hunters & Career Builders - HannahEd
- Học bổng ngắn hạn, trao đổi, tình nguyện - HannahEd
- English Club HEC
- Scholarship Hunters
- Web/tiktok/insta: hannahed.co
- Youtube: HannahEd
🌍📚Những #Schofan quyết tâm và muốn chuẩn bị kĩ cho nhiều học bổng từ giờ thì mau mau đăng kí lớp tìm và apply học bổng #HannahEd đã có lịch các lớp tháng 11, 12 và chương trình Mentor, Review hồ sơ, Tập phỏng vấn.
Link này để nhận thêm thông tin hoặc email [email protected] nhé:
http://tiny.cc/HannahEdClassInfo
https://hannahed.co/lop-tim-va-nop-hoc-bong/
❤ Like và share nếu các em thấy thông tin có ích nhé ❤
#HannahEd #duhoc #hocbong #sanhocbong #scholarshipforVietnamesestudents
「google analytics for business intelligence」的推薦目錄:
google analytics for business intelligence 在 Bà Dì Nulo Facebook 的最佳貼文
#nulo_career
Bi, Ba cái gương và thủy tinh cầu
Bi là gì?
dì mới thấy 1 job ở SG khá hay đang tuyển dành cho fresh nên dì muốn share cho các cháu thích làm việc với data, dân ngành nào cũng đâm sang được miễn thích data, tools và luôn thích tự học.
Bi là Business Intelligence
Ba là Business Analytics
2 bạn này là 2 môn phái giúp cho doanh nghiệp đưa ra 1 quyết định trọng đại (Decision making)
BI BA khác nhau chứ
BI là tạo ra một tấm gương từ dữ liệu từ 30 giây cho đến rất nhiều năm trước để doanh nghiệp nhìn vô xem lại cái nết ăn ở, tình hình kinh doanh vừa qua của mình để cải thiện sửa đổi
BA là tạo ra quả cầu thủy tinh cho thấy tương lai- từ data của thị trường và doanh nghiệp, để mí bác lãnh đạo hiểu và dự đoán những thứ sắp xảy ra vd như dự định market entrance- thâm nhập và làm ăn ở 1 thị trường mới chẳng hạn,
Người Bi và Ba kiểu gì cũng phải làm lấn sân nhau 1 xíu để có kiến thức kỹ năng toàn diện hơn
tạm vậy đã, cho các cháu biết và phân biệt 2 job tưởng là 1 mà là 2 này, khi nào rảnh dì viết thêm, các cháu có thể tự tìm hiểu thêm nhe
Bên dưới là job đang tuyển cho fresh, JD điển hình cho BI
Intrepid Vietnam is looking for
Junior BI Analyst (8-10 mil experience based)
Deadline for application: 26/2/2020
The role:
We are looking for a generalist, who is eager to learn and has an eye for detail. As a Junior BI Analyst, you will be using different tools to
- Develop and automate internal & external reports
Build dashboards to visualize quantitative information
- Maintain database and other documents
- Fulfill ad-hoc requests
Who we look for – the ideal profile:
- Intermediate English and above
- From 6 months of experience in Ecommerce or in a data-driven position of other industries.
- Advanced Excel and Google sheet is a must.
- Strong logical thinking and problem-solving skills is a must.
- Good communication & ability to probe for users’ data needs.
- Ability to operate independently as well as work in a team.
- Good fit with our company culture: collaborative, open, humble, driven, analytical, structured,
professional, fun, passionate, entrepreneurial with a hands-on - “Can do” mindset
Good to have
- Basic understanding of data modeling is preferred.
- Some experience with languages for ETL such as SQL, Python is a plus.
- Some experience with data visualization tools such as Data Studio, Power BI, Tableau, etc. is a
plus.
What we offer
- Competitive compensation (with 13th month annual bonus)
Opportunity to be a key part of a fast-growing leading Ecommerce enabler in SEA, offering
exciting career opportunities
- Ample opportunity for personal and professional development, both on the job and through
regular training (Ecommerce & (Digital) Marketing topics, soft skills and leadership training).
- English speaking international environment, open, collaborative and fun culture, and a nice & centrally located office (WeWork D4)
- Additional 2 annual leave (besides regular annual leave for all Vietnamese holidays recognized by Vietnamese labor law and 12 days personal annual leave).
About Intrepid Vietnam
Intrepid is a fast-growing and industry-leading ecommerce enabler, making sellers and brands successful in Ecommerce on all marketplace platforms across South East Asia through a combination of software solutions and value-added services across store management, online marketing, customer service (e.g. chat), data & intelligence, and fulfilment & logistics. The company operates in Indonesia, Philippines,Singapore, Vietnam, Thailand and soon Malaysia, was built by ex-Lazada founders and is run by a young, enthusiastic and energetic team, looking to help brands and sellers seize the full potential of the ecommerce opportunity in South East Asia
Application:
Email title [Job name] [YourName] [+ Badinulomember-để được ưu tiên xíu xíu <3 ]
contact:
[email protected]
google analytics for business intelligence 在 โปรแกรมเมอร์ไทย Thai programmer Facebook 的最讚貼文
ในวิชา "วิทยาการคำนวณ" ระดับชั้น ม. 5
ได้ดึงวิชา data science (วิทยาศาสตร์ข้อมูล)
มาปูพื้นฐานให้เด็กๆ ได้เรียนกันแล้ว นับว่าเป็นโชคดี
เพราะวิชาพวกนี้เป็นของสูง กว่าจะสัมผัสก็คงตอนป.ตรี โท เอก
...Continue ReadingIn the subject of ′′ Calculation Theology ′′ class. 5
Pulled data science (data science)
Let's master the foundation for kids to learn. It's considered lucky.
Because these subjects are high to touch. It's probably in the middle of the year. Tri To Aek
Which I will review the content to read roughly. The content is divided into 4 chapters.
.
👉 ++++ Chapter 1-Information is valuable +++++
.
Data science in the textbook. Used by Thai name as ′′ Information Science ′′
This chapter will mention Big Data or big data with lots of valuable information.
And so much role in this 4.0 s both public and private sector.
.
If you can't imagine when you played Google search network, you'll find a lot of information that you can use in our business. This is why data science plays a very important role.
.
It's not surprising that it makes the Data Scientist s' career (British name data scientist) play the most important role and charming and interesting profession of the 21th century.
.
Data science, if in the book, he defines it
′′ Study of the process, method or technique to process enormous amounts of data to process to obtain knowledge, understand phenomena, or interpret prediction or prediction, find out patterns or trends from information.
and can be analysed to advise the right choice or take decision for maximum benefit
.
For Data science work, he will have the following steps.
- Questioning my own interest.
- Collect information.
- Data Survey
- Data Analysis (analyze the data)
- Communication and Results Visualization (Communicate and visualize the results)
.
🤔 Also he talks about design thinking... but what is it?
Must say the job of a data scientist
It doesn't end just taking the data we analyzed.
Let's show people how to understand.
.
The application design process is still required.
To use data from our analytics
The word design thinking is the idea. The more good designer it is.
Which Data Scientists Should Have To Design Final Applications
Will meet user demand
.
👉 ++++ Chapter 2 Collection and Exploration +++++
.
This chapter is just going to base.
2.1 Collection of data
In this chapter, I will talk about information that is a virtual thing.
We need to use this internet.
2.2 Data preparation (data preparation)
Content will be available.
- Data Cleaning (data cleansing)
- Data Transformation (data transformation)
In the university. 5 is not much but if in college level, you will find advanced technique like PCA.
- Info Link (combining data)
2.3 Data Exploration (data exploration)
Speaking of using graphs, let's explore the information e
Histogram graph. Box plot diagram (box plot). Distributed diagram (scatter plot)
With an example of programming, pulls out the plot to graph from csv (or xls) file.
2.4 Personal Information
For this topic, if a data scientist is implementing personal data, it must be kept secret.
.
Where the issues of personal information are now available. Personal Data Protection is Done
.
.
👉 ++++ Chapter 3 Data Analysis ++++
.
Divided into 2 parts:
.
3.1 descriptive analysis (descriptive analytics)
Analyzing using the numbers we've studied since
- Proportion or percentage
- Medium measurement of data, average, popular base.
Correlation (Correlation) relationship with programming is easy.
.
.
3.2 predictive analysis (predictive analytics)
.
- numeric prediction is discussed. (numeric prediction)
- Speaking of technique linear regression, a straight line equation that will predict future information.
Including sum of squared errors
Let's see if the straight line graph is fit with the information. (with programming samples)
- Finally mentioned K-NN (K-Nearest Neighbors: K-NN) is the closest way to finding K-N-Neighborhood for classification (Category)
*** Note *****
linear regression กับ K-NN
This is also an algorithm. One of the machine learning (machine learning, one branch of AI)
Kids in the middle of the day, I get to study.
.
.
👉 +++ Chapter 4 Making information pictured and communicating with information +++
.
This chapter doesn't matter much. Think about the scientist after analyzing what data is done. The end is showing it to other people by doing data visualization. (Better summoning)
.
In contents, it's for example using a stick chart, line chart, circular chart, distribution plan.
.
The last thing I can't do is tell a story from information (data story telling) with a message. Be careful when you present information.
.
.
.
*** this note ***
😗 Program language which textbooks mentioned and for example.
It's also python and R language
.
For R language, many people may not be familiar.
The IT graduate may be more familiar with Python.
But anyone from the record line will surely be familiar.
Because R language is very popular in statistical line
And it can be used in data science. Easy and popular. Python
.
But if people from data science move to another line of AI
It's deep learning (deep learning)
Python will be popular with eating.
.
.
#########
😓 Ending. Even I wrote a review myself, I still feel that.
- The university. 5 is it going to be hard? Can a child imagine? What did she do?
- Or was it right that I packed this course into Big Data era?
You can comment.
.
But for sure, both parents and teachers are tired.
Because it's a new content. It's real.
Keep fighting. Thai kids 4.0
.
Note in the review section of the university's textbook. 4 There will be 3 chapters. Read at.
https://www.facebook.com/programmerthai/photos/a.1406027003020480/2403432436613260/?type=3&theater
.
++++++++++++++++++++
Before leaving, let's ask for publicity.
++++++++++++++++++++
Recommend the book ′′ Artificial Intelligence (AI) is not difficult ′′
It can be understood by the number. End of book 1 (Thai language content)
Best seller ranked
In the MEB computer book category.
.
The contents will describe Artificial Intelligence (A) in view of the number. The end.
Without a code of dizzy
With colorful illustrations to see, easy to read.
.
If you are interested, you can order.
👉 https://www.mebmarket.com/web/index.php?action=BookDetails&data=YToyOntzOjc6InVzZXJfaWQiO3M6NzoiMTcyNTQ4MyI7czo3OiJib29rX2lkIjtzOjY6IjEwODI0NiI7fQ&fbclid=IwAR11zxJea0OnJy5tbfIlSxo4UQmsemh_8TuBF0ddjJQzzliMFFoFz1AtTo4
.
Personal like the book. You can see this link.
👉 https://www.dropbox.com/s/fg8l38hc0k9b0md/chapter_example.pdf?dl=0
.
Sorry, paper book. I don't have it yet. Sorry.
.
✍ Written by Thai programmer thai progammerTranslated