로딩이미지

2차 결제하기(클릭)
위의 2차 결제하기 버튼을
클릭해주세요.
2차 결제 미진행시 배송료가
추가 결제될 수 있습니다.

수험정보>국제자격증>FDP>수험정보

About FDP

FDP(Financial Data Professional, 금융 데이터 전문가)는 Big Data, Machine Learning, AI(artificial intelligence) 등의 기술 발달이 주도하는 디지털 전환(Digital Transformation)에 대비하여 관련 기술의 이론과 원리를 이해하고 금융 분야와 관련한 다양한 데이터를 알고리즘에 자유자재로 적용하고 분석할 수 전문가입니다.

최근 금융 산업은 디지털 전환으로 급변하고 있습니다. 이에 기존 금융 산업 내 종사자뿐만 아니라 금융 산업으로의 취업을 꿈꾸는 취업준비생과 학생에게도 Big Data, Machine Learning, AI 등 디지털 전환과 관련한 이론 및 실무 지식이 요구되고 있습니다. 이러한 변화에 발 빠르게 대처하지 않으면 빠르게 진화하고 있는 금융 산업에서 살아남기 어렵습니다.

순수 Big Data, Machine Learning, AI 등의 이론과 개념은 광범위할 뿐 아니라 통계, 선형대수, 프로그래밍 등의 사전 배경 지식을 기본적으로 요구합니다. 이상적으로 사전 배경 지식을 습득하고, 관련 이론과 개념을 배우고 이해하면 좋겠지만, 현실적으로 상당 시일의 시간과 학습 노력이 필요함에 따라 달성하기 쉽지 않습니다. FDP 시험은 선택과 집중을 통해 이에 대한 해결책을 제시합니다. 금융과 밀접한 Big Data, Machine Learning, AI 등을 선별하여 관련 이론과 개념을 배움으로써 초기 진입 장벽을 낮춰주고 금융인으로서 당장 필요할 수 있는 기술 적용 사례 등에 집중함으로써 필요에 의해 공부할 환경을 조성해줍니다.

FDP 협회는 Big Data, Machine Learning, AI 등의 배경 지식 범위를 금융 분야와 관련한 내용 중심으로 구성하여 “금융 데이터 사이언스”에 대한 중요한 개념과 이론 및 실무 지식을 배울 수 있도록 교과 과목을 완성하였습니다. 기초 확률 및 통계, Big Data, Machine Learning, AI 등에 대한 이론 지식부터 실무 적용 사례, 관련 최신 학술 논문에 이르기까지 금융 데이터 전문가가 되기 위한 초석으로의 학습 자료로서의 완성도가 높습니다.

2019년부터 시행되고 있는 FDP 시험 역시 디지털 전환에 따른 금융 산업 변화와 함께 진화하고 있습니다. 금융권 내 대체 데이터(alternative data)에 대한 수요와 공급 증가, 기계학습 알고리즘 및 인공지능 기법을 활용한 금융서비스 증가 등 최신 금융 산업 내 기술 적용 추세와 새로운 기술과 금융 및 경제 이론의 조화 등의 내용은 현 금융 산업 내 종사자 및 예비 종사자에게 디지털 전환에 적절히 대비할 수 있는 양질의 지식을 얻을 수 있는 좋은 기회를 제공합니다.

Digital Transformation

1.시험 접수 절차

STEP 1 FDP 협회 홈페이지(www.fdpinstitute.org)에서 회원가입을 합니다.
STEP 2 FDP 협회가 제공하는 안내서(handbook)를 주의 깊게 읽어봅니다.
STEP 3 FDP 협회 시험 등록 기간 및 등록비용을 확인하고, 비용 결제까지 완료합니다.
STEP 4 시험 응시 장소 결정 : 코로나 19의 영향으로 시험 응시 장소는 2가지 선택지가 있습니다.

Option 1 : Prometric Testing Center* 에 직접 가서 시험 응시
Option 2 : Remotely Proctored Testing으로 수험생이 직접 장소를 선택하고, FDP에서 요구하는 카메라 환경 등을 구비하여 시험 응시

* Prometric Testing Center
주소 : 서울시 중구 퇴계로 성우빌딩 6층 HSF Inc / 연락처 : 00798142030248

2.응시 자격

· 별도의 자격요건은 없으나 FDP 시험을 치루기 이전 혹은 이후에 Python, R 등에 대한 기초 온라인 수업을 수강하여야 합니다.

· 온라인 수업은 Datacamp, Dataquest, Metis 중 하나를 선택하여 수강하면 되고, 대략 8~10시간 정도의 분량입니다.

웹사이트 프로그램 수강 과목
Datacamp
(https://www.datacamp.com)
Python Introduction to Python
Intermediate Python for Data Science
R Introduction to R
Intermediate R
DataQuest
(https://www.dataquest.io)
Python Python for Data Science: Fundamentals
Python for Data Science: Intermediate
R Introduction to Data Analysis in R
Data Structures in R
Metis
(https://www.thisismetis.com)
- Python Basics
Python Advanced
Python Mathematical Libraries
Linear Algebra
Calculus and Probability
Statistics

1. 시험 비용

FDP Exam: October 25 - November 7, 2021

Registration

Early Registration Opens Early Registration Closes Registration Closes Exam Window
April 30, 2021 June 18, 2021 September 17, 2021 October 18 - 31, 2021

FDP Exam: April 4 - April 17, 2022

Registration

Early Registration Opens Early Registration Closes Registration Closes Exam Window
November 22, 2021 January 7, 2022 March 4, 2022 April 4 - 17, 2022

Exam Fees

Early Registration Standard Registration Retake
Registration Fee(refund policy) $950 $1150 $450
Enrollment Fee(refund policy) $400 $400 -
Total FDP Exam Fee $1350** $1350** $450**

* Exam fees do not include the cost of reading materials. We strongly recommend that candidates act early to obtain the readings in oreder to allow enough study time.

** Canadian taxes will be applied

2.시험 구성

시험 시간 4시간
문제 구성 객관식(3지 혹은 4지 선다형) 문항 75개 & 주관식(2~4개 세트)
문제 유형 Multiple Choice Questions(객관식) & Constructed Response Questions(주관식)
채점방식 FDP 협회에서 합격점수에 대한 정보 비공개

· 시험은 CBT(Computer-based testing으로 진행되며 응시 후 결과는 통상 5주일 이내에 공개됩니다.

· 점수는 공개되지 않고, 각 토픽별로 응시생 평균을 상회했는지 하회했는지 정도만 공개됩니다.

· 결과 재검토 요청이 가능하며, 재검토 요청 비용은 $100입니다.

Exam day schedule
Nondisclosure Agreement (must be completed within 5 minutes) 5 minutes
Exam instructions 5 minutes
FDP Multiple Choice Questions 135 minutes
Nondisclosure Agreement (must be completed within 5 minutes) 5 minutes
Break (optional) 20 minutes
FDP Constructed Response Questions 65 minutes
Comment Period (Optional) 10 minutes
Exam Session Time 4 Hours

· 시험은 총 4시간으로 2개의 Section으로 구성되며, 휴식시간은 20분입니다.

· 객관식 시험(Multiple Choice Questions)은 3지선다형과 4지선다형 문제가 함께 출제됩니다.

· 객관식 시험은 165분 동안 75문제를 풀어야 합니다.

· 주관식 시험(Constructed Response Questions)은 주관식으로 2~4문제가 출제됩니다.

· 주관식 시험은 65분 동안 Essay 2~4세트를 풀어야 합니다.

· 객관식, 주관식 시험 모두 오답에 대한 패널티는 없습니다.

■ Multiple Choice sample screen shot


Multiple Choice sample screen shot

■ Constructed Response sample screen shot


Constructed Response sample screen shot

3.FDP 시험과목 및 출제비중

Topics Approximate Weight %
1. Introduction to Data Science & Big Data 5 - 10

■ Data analytic thinking

■ Business problems and data science solutions

■ Adoption of alternative data

■ The risks and rewards of alternative data for investment decisions

■ Advanced technologies for alpha

■ Alternative data vendor profiles

■ The future of alternative data

■ Warming up to collective intelligence investing (CII)

■ Getting started with alternative data and CII

■ Balancing the risks and rewards of CII from different platform types

■ The road ahead for investment managers

■ Understanding why “Wall Street” wants data

■ Building a data product

■ Delivering your data

■ Marketing and selling your data

■ Protecting yourself and your data

■ Pricing your data

■ Case studies


Readings for Introduction to Data Science & Big Data

1. Provost, F. and T. Fawcett. (2013). Data Science for Business. Sebastopol, CA: O’Reilly Media Inc.

• Chapter 1 – Introduction : Data-Analytic Thinking

• Chapter 2 – Business Problems and Data Solutions

2. Dannemiller, D. and R. Kataria. (2017). Alternative data for investment decisions: Today’s innovation could be tomorrow’s requirement by Deloitte Center for Financial Services.

3. Gajjaria, A. (2018). Collective intelligence investing: Alpha generation via alternative data brings new risks by Deloitte Center for Financial Services.

4. Quandl (2017). Sell Your Data to Wall Street: The comprehensive guide to monetizing your data assets for professional investors.

2. Machine Learning : Introduction to Algorithms 5 - 10

■ Organization and resources of the book An Introduction to Statistical Learning: with applications in R

■ Statistical learning

■ Assessing Model Accuracy

■ Motivation for using neural nets to recognize handwritten digits

■ Perceptron neurons

■ Sigmoid neurons

■ The architecture of neural networks

■ A simple network to classify handwritten digits

■ Learning with gradient descent

■ Implementing a network to classify digits

■ Why deep learning matters


Readings for Machine Learning: Introduction to Algorithms

1. James, G., D. Witten, T. Hastie and R. Tibshirani. (2013). An Introduction to Statistical Learning: with applications in R. New York, NY: Springer. Chapters 1, 2.1 & 2.2

• Chapter 1 – Introduction

• Chapter 2.1 - What is Statistical Learning?

• Chapter 2.2 – Assessing Model Accuracy

2. Nielsen, M. A. (2015). Using Neural Networks to Recognize Handwritten Digits. In Neural Networks and Deep Learning, Determination Press

3. Machine Learning : Regression, Support Vector Machine & Time Series Models 5 - 10

■ Models, induction and prediction

■ Supervised segmentation

■ Visualizing segmentations

■ Classification via mathematical functions

■ Regression via mathematical functions

■ Simple linear regression

■ Multiple linear regression

■ Considerations in the regression model

■ Concepts of time series

■ Statistical models

■ Modeling volatility


Readings for Machine Learning: Regression, Support Vector Machine, Time Series Models

1. Provost, F. and T. Fawcett. (2013). Data Science for Business. Sebastopol, CA: O’Reilly Media Inc.

• Chapter 3 - Introduction to Predictive Modeling: From Correlation to Supervised Segmentation

• Chapter 4 - Fitting a Model to Data

2. James, G., D. Witten, T. Hastie and R. Tibshirani. (2013). An Introduction to Statistical Learning: with applications in R. New York, NY: Springer

• Chapter 3 – Simple Linear Regression

3. Aas, K. and X. K. Dimakos. (2004). Statistical modeling of financial time series: An introduction. Oslo Norway: Norwegian Computing Center

4. Machine Learning : Regularization, Regression Trees, Random Forest & Overfitting 5 - 10

■ Overfitting and its avoidance

■ Subset selection

■ Shrinkage methods

■ Tree-Based methods


Readings for Machine Learning: Regularization, Regression Trees, Random Forest & Overfitting

1. Provost, F. and T. Fawcett. (2013). Data Science for Business. Sebastopol, CA: O’Reilly Media Inc.

• Chapter 5 – Overfitting and Its Avoidance

2. James, G., D. Witten, T. Hastie and R. Tibshirani. (2013). An Introduction to Statistical Learning: with applications in R. New York, NY: Springer.

• Chapter 6.1 – Best Subset Selection

• Chapter 6.2 – Shrinkage Methods

• Chapter 8.1 – The Basics of Decision Trees

• Chapter 8.2 – Bagging, Random Forests, Boosting

3. Aas, K. and X. K. Dimakos. (2004). Statistical modeling of financial time series: An introduction. Oslo Norway: Norwegian Computing Center

5. Machine Learning : Classification & Clustering 5 - 10

■ Calculating and interpreting similarity and distance

■ Discussing technical details related to similarities and neighbors

■ Describing and evaluating classifiers

■ Describing a key analytical framework and calculating expected values


Readings for Machine Learning: Classification & Clustering

1. Provost, F. and T. Fawcett. (2013). Data Science for Business. Sebastopol, CA: O’Reilly Media Inc.

• Chapter 6 – Similarity, Neighbors, and Clusters

• Chapter 7 – Decision Analytic Thinking : What Is a Good Model?

6. Machine Learning : Performance Evaluation, Backtesting & False Discoveries 5 - 10

■ Visualizing model performance

■ Backtesting protocol in the era of machine learning

■ An investigation of the false discovery rate and the misinterpretation of p-values

■ A data science solution to the multiple-testing crisis


Readings for Machine Learning : Performance Evaluation, Support Vector Machines & False Discoveries

1. Provost, F. and T. Fawcett. (2013). Data Science for Business. Sebastopol, CA: O’Reilly Media Inc.

• Chapter 8 – Similarity, Neighbors, and Clusters

2. Arnott, R., C. B. Harvey, and H. Markowitz. (2019). A Backtesting Protocol in the Era of Machine Learning. Journal of Financial Data Science, 1(1), 64-74

3. Colquhoun, D. (2014). An investigation of the false discovery rate and the misinterpretation of p-values. Royal Society Open Science, London, U.K.

4. >López de Prado, M. (2019). A Data Science Solution to the Multiple-Testing Crisis in Financial Research. Journal of Financial Data Science, 1(1), 99-110.

7. Data Mining & Machine Learning : Naïve Bayes & Text Mining 5 - 10

■ Evidence and probabilities

■ Broad issues involved in mining text

■ Text representation

■ Additional text representation approaches beyond “bag of words.”

■ Classification

■ Math behind Naïve Bayes classifiers

■ Training the Naïve Bayes classifiers

■ Optimizing for sentiment analysis

■ Evaluation of sentiment analysis results


Readings for Data Mining & Machine Learning: Naïve Bayes & Text Mining

1. Provost, F. and T. Fawcett. (2013). Data Science for Business. Sebastopol, CA: O’Reilly Media Inc.

• Chapter 9 – Evidence and Probabilities

• Chapter10 – Representing and Mining Text

2. Jurafsky, D. and J. Martin. (2018). In Speech and Language Processing

• Chapter 4 – Naïve Bayes and Sentiment Classification

8. Big Data & Machine Learning : Ethical & Privacy Issues 5 - 10

■ Big data for business

■ Ethical issues

■ The ethics test

■ The nature of and business risks of artificial intelligence (AI)

■ Values that form the cornerstone of an ethical framework for artificial intelligence in business

■ The role of business decision-makers

■ General Data Protection Regulation (GDPR)

■ Separating ethics and compliance

■ Separating ethics and compliance

■ The GDPR Embedding Wheel

■ Doing good data science

■ Oaths and checklists

■ The five C’s

■ Taking responsibility for our creations (Data’s Day of Reckoning)


Readings for Big Data & Machine Learning: Ethical & Privacy Issues

1. Institute of Business Ethics. (2016, June). Business Ethics and Big Data (IBE Issue 52). London, U.K.

2. Institute of Business Ethics. (2018, January). Business Ethics and Artificial Intelligence (IBE, Issue 58). London, U.K.

3. Institute of Business Ethics. (2018, May). Beyond Law: Ethical Culture and GDPR (IBE, Issue 62). London, U.K.

4. Loukides, M., M., H. Mason and DJ. Patil. Ethics and Data Science

9. Big Data & Machine Learning in the Financial Industry 30 - 50

■ Artificial intelligence and its techniques

■ Applications of AI and Five Technologies Trends that Leap-Frog AI

■ Machine learning and finance

■ Artificial Intelligence in Investment Management

■ Four Pillars for Transformation of Investment Management Firms

■ Adoption and Implementation Risks

■ Regulatory and supervisory issues around FinTech

■ Relationship between artificial intelligence, machine learning, and big data, and algorithms

■ Categories of machine learning algorithms

■ Drivers of the growth in the use of fintech and adoption of artificial intelligence

■ Use cases of artificial intelligence and machine learning in the financial sector

■ The micro-financial analysis of artificial intelligence and machine learning uses

■ The macro-financial analysis of uses of artificial intelligence and machine learning uses

■ Define the terms listed in the glossary

■ Alternative data and institutional investors

■ Applications of random forest regression algorithm to factor models

■ The applications of machine learning algorithms to stock selection

■ Applications of machine learning algorithms to empirical asset pricing

■ The most common errors made when machine learning techniques are applied to financial data sets

■ Using statistical techniques to evaluate trading strategies in the presence of multiple tests

■ Text mining and its applications in the insurance industry


Readings for Big Data & Machine Learning in the Financial Industry

1. Deloitte. (2018) Artificial intelligence.

2. AQR Portfolio Group Solutions (2019). Can machines “learn” finance?

3. Deloitte. (2019) Artificial intelligence: The next frontier for investment management firms.

4. Financial Stability Board. (2017). Artificial Intelligence and Machine Learning in Financial Services: Market Developments and Financial Stability Implications.

5. Monk, A., M. Prins, and D. Rook. (2019). Rethinking Alternative Data in Institutional Investment. Journal of Financial Data Science, 1(1), 14-31.

6. Simonian, J., C. Wu, D. Itano and V. Narayanan. (2019). A Machine Learning Approach to Risk Factors: A Case Study Using the Fama–French–Carhart Model. Journal of Financial Data Science, 1(1), 32-44.

7. Rasekhschaffe, K. and R. Jones. (2019). Machine Learning for Stock Selection. Financial Analyst Journal, 13 June 2019 Volume 75, Issue 3.

8. Gu, S., B. Kelly, and D. Xiu. (2018). Empirical Asset Pricing via Machine Learning.

9. López de Prado, M. (2018). The 10 Reasons Most Machine Learning Funds Fail. The Journal of Portfolio Management, 44 (6) 120-133.

10. Harvey, C. R. and Y. Liu. (2014). Evaluating Trading Strategies. [Special 40th Anniversary Issue]. The Journal of Portfolio Management, 40(5), 108-118.

11. Zappa, D., M. Borrelli, G.P. Clemente, N. Savelli. Text Mining In Insurance.

1.시험 장소 및 일정

시험장소는 Prometric Center 입니다.

장소 연락처 주말 실시 평일 실시 지도
서울시 중구 퇴계로 성우빌딩 6층 HSF Inc
(Hsf Inc. 6th floor Sungwoo B/D 324, Toegye-ro, Jung-gu, Seoul)
00798142030248 o o

* 시험 응시 장소는 2가지 선택지가 있습니다.

• Option 1

- Prometric Testing Center에 직접 가서 시험을 치루는 것(대표 시험장소: 서울 중구 퇴계로 성우 빌딩 6층 HSF Inc.).

- 2021년 10월 시험 기준 10월 18일~10월 31일 중 하루를 선택하고 Prometric Testing Center 사이트로 가서 예약하면 됩니다.

• Option 2

- Remotely Proctored Testing으로 수험생이 직접 장소를 선택하고, FDP에서 요구하는 카메라 환경 등을 구비하여 시험을 치루는 것.

- 2021년 10월 시험 기준 10월 31일 혹은 11월 1일 중에 하루를 선택하고, 원격 감독 시험을 요청하시면 됩니다.

2.시험 결제 및 취소 정책

1) FDP 재시험 시 Retake 비용 $450만 지불하고 시험 응시 가능합니다.

2) CAIA 멤버는 FDP 첫 시험 등록 시 시험비가 20% 할인됩니다.(CAIA ID number 제출)

1.시험 유의사항

• 체크아웃

시험을 완전히 종료할 시에 손을 들어 시험 진행요원에게 알리고 노트와 마커를 제출해야 하며, 시험이 끝남을 알린 다음에 시험장을 나갈 수 있습니다.
시험장을 나온 직후 시험 시간 중에 착석한 자리를 입증하는 증서를 받게 됩니다.
증서에는 시험 결과 발표 일정 등의 정보가 있습니다.


• 시험 진행 중 문제 사항 보고

수험생이 시험 센터 혹은 시험 진행요원이 시험 진행 중 행정 절차 관련 건의사항이 있는 경우, FDP 협회 이메일(candidate@fdpinstitute.org)로 연락하면 됩니다.
연락 시 해당 사건의 상세한 묘사(일자, 시험 센터명, 사건 유형, 관련자 이름, 보고자 연락처)를 반드시 포함하여야 합니다.
이메일 회신은 수신 이후 2~3주 정도가 소요될 수 있으며, 결과에 따라서 필요시 조치를 취할 것입니다.

2.채점 및 결과 발표

• 시험 채점

FDP 협회는 해당 시험 기간에 응시한 모든 수험생 답안이 회수된 이후 채점을 시작합니다.
이는 해당 시험 기간 중 모든 시험이 종료되기 전에는 채점할 수 없다는 의미입니다.
시험 출제 위원은 시험 시행 전후로 모든 문항을 검토하고, 오류를 찾습니다.
만약 출제 위원이 판단하기에 충분히 불명확한 사항을 포함하고 있는 문항은 시험 채점에서 제외될 수 있습니다.


• 시험 결과 및 결과 리포트

시험 결과는 마지막 시험 응시일자 이후 5주일 이내에 공개됩니다.
시험 결과를 받을 연락처를 변경하는 경우, 변경사항을 업데이트 해야 시험 결과를 적시에 받을 수 있습니다.
수험생의 시험 결과에 관한 정보는 철저히 기밀입니다. 시험 결과는 합격 혹은 불합격으로 확인이 가능합니다.
점수에 대한 자세한 사항은 명시 되지 않습니다.


• 점수 재검토 요청

시험 점수에 대해 의문을 가지는 수험생을 결과 리포트를 수령한 이후 점수 재검토 요청을 할 수 있습니다.
개별 토픽에서 획득한 점수는 절차에 따라 다시금 확인되고 보고된 점수와 비교될 것입니다.
이는 모든 문제가 다시 채점됨을 의미하지 않습니다. 점수 재검토 요청 비용은 $100입니다.
점수 재검토 요청은 FDP 협회 이메일(candidate@fdpinstitute.org)로 합니다.
결과 리포트를 수령한 후 30일 이내에 제출해야 합니다.

토픽별 학습전략

토픽1 : Introduction to Data Science & Big Data

데이터 사이언스와 빅데이터 전반에 대한 주요 개념과 실제 금융권에서의 활용 사례 전반을 다룹니다. 데이터 마이닝, 데이터 사이언스, 지도학습 및 비지도학습 등에 대한 기본 개념과 함께 최근 금융권에서 주목하는 대체 데이터(Alternative data)의 개념, 활용 현황, 위험 요인, 앞으로의 미래 등을 포함합니다. 또한, 최근 월가에서 어떤 데이터를 원하고 있는지, 데이터 수요자에게 데이터를 판매함에 있어 어떠한 요인이 중요한지 등 실무적인 내용도 직관적이고 어렵지 않은 수준으로 학습합니다.

(학습 전략)

금융권내 빅데이터, 데이터 사이언스와 관련한 최근 추세를 손쉽게 학습할 수 있습니다. FDP 본격 커리큘럼에 들어가기 전에 부담 없이 읽으면서 학습하는 토픽입니다.


토픽2 : Machine Learning: Introduction to Algorithms

본격적인 빅데이터, 기계학습, 인공지능의 배경 지식이 되는 이론 전반을 다룹니다. 첫째로는 통계 이론입니다. 회귀분석, 베이즈 이론, K-nearest neighbors 등에 대한 주요 개념과 통계적 학습, 모델 정확도 평가 등 통계 분석상 주요 이슈를 포함합니다. 둘째로는 인공지능 이론입니다. 인공지능 네트워크 구성 요소에 대한 주요 개념과 네트워크 학습 과정 및 방법, 학습 시 유의사항 등을 배웁니다. 비전공자들에게는 다소 어려울 수 있으나, 복잡한 계산을 직접 하는 것이 아니므로 큰 틀에서 왜 이런 개념이 중요한지와 어떤 원리로 분석되는지, 결과를 어떻게 해석할지에 집중하면 됩니다.

(학습 전략)

통계, 기계학습, 인공지능 관련 기본 지식은 앞으로 나올 토픽에서 계속 언급되기 때문에 관련 개념, 원리를 반복적으로 학습하여 익숙해지는 게 중요합니다.


토픽3 : Machine Learning: Regression, Support Vector Machine & Time Series Models

금융 데이터 분석에서 많이 활용되는 회귀분석, 서포트 벡터 머신, 시계열 분석에 대해 다룹니다. 개별 분석 모델에 대한 기본 개념을 배우고, 예측 모델링(predictive modeling) 전반에 대해 학습합니다. 데이터 마이닝, 데이터 세분화, 정보 이론(정보, 엔트로피 등), 트리 기반 모델 등에 대해 배웁니다. 그리고 서포트 벡터 머신 및 로지스틱 회귀분석의 주요 개념과 활용, 단순 회귀분석과 다중 회귀분석의 분석상 유의사항, AR, GARCH 등 시계열 모델의 개념과 모델 검증 방법 등에 대해 학습합니다.

(학습 전략)

토픽3은 수리적 배경 지식을 많이 필요로 합니다. 비전공자라면 이번 기회에 관련 수식을 익힐 좋은 기회로 삼을 수 있습니다. 다행히도 모든 수식을 외우거나 실제 계산할 필요는 없습니다. 수식과 알고리즘이 무엇을 의미하는지, 어떻게 활용하는지에 집중하면 됩니다.


토픽4 : Machine Learning: Regularization, Regression Trees, Random Forest & Overfitting

실제 데이터를 가지고 모델을 학습하는 방법을 배웁니다. 전체 데이터를 학습 데이터, 검증 데이터, 테스트 데이터 등을 구분하고, 교차 검증 방법 등을 통해 모델링하는 방법을 학습합니다. 일반화, 오버피팅, 정규화 등의 개념과 왜 이런 개념이 중요한지를 배웁니다. 그리고 실제 사례를 통해 회귀분석과 트리 기반 모델과 관련하여 변수 선별 방법, 모델의 성능 지표 등의 개념과 일반화, 오버피팅, 정규화 등을 어떻게 적용하는지를 다룹니다.

(학습 전략)

실제 데이터를 어떻게 모델링하는지와 실무상 예측 모델을 적용함에 있어 발생 가능한 이슈를 배울 수 있습니다. 실제 해당 업무를 수행하는 금융 종사자 혹은 데이터 분석가는 업무에 직, 간접적으로 활용할 수 있을 것이라 판단됩니다.


토픽5 : Machine Learning: Classification & Clustering

분류 및 군집화에 대해 집중적으로 배웁니다. 유사성을 어떻게 정의하고, 측정하는지에 따라 그룹내 데이터 분류와 군집화가 달라질 수 있습니다. 거리, Nearest-Neighbor 등을 통해 실제 데이터에 대한 분류와 군집화 사례를 살펴봅니다. 또한, 혼동 행렬(confusion matrix) 등을 통한 분류기(classifier)의 성능을 평가하고, 기댓값 등 확률론에 기반하는 분류기 평가 등도 학습합니다.

(학습 전략)

실제 데이터를 활용한 분류 모델링, 군집화를 배울 수 있습니다. 분류 및 군집화에 쓰이는 용어의 개념을 확실하게 암기하고, 실제 분류 모델링 과정을 따라가면서 과정상 중요 내용과 성능 평가를 어떻게 하는지를 중점적으로 학습하면 됩니다. 실무상 직, 간접적으로 활용할 수 있을 것이라 판단됩니다.

토픽6 : Machine Learning: Performance Evaluation, Backtesting & False Discoveries

모델 성능을 시각화한 그래프인 Profit curve, Cumulative response curve, ROC curve 등에 대해 배웁니다. curve 그래프의 의미와 어떻게 해석하는지를 학습합니다. 그리고 실제 금융 데이터 모델링 과정에서 흔히들 보이는 1종 오류(false positives)의 원인을 살펴보고, 1종 오류를 피하기 위한 백테스팅 프로토콜을 배웁니다. 또한, p-value 해석시 유의사항, 다중 테스트에 따른 편향 등에 대해 최신 논문을 통해 학습합니다.

(학습 전략)

이전 토픽에서 기본 개념과 모델링하는 기법에 집중했다면, 토픽6은 모델의 성능을 어떻게 평가하는지에 집중합니다. 그리고 모델 검증시 활용되는 통계량을 해석함에 있어 유의해야 될 사항을 학술 논문을 통해 살펴봅니다. 기본 개념 학습에서 벗어나 금융 데이터 전문가로서 기존 통계량에 대한 비판적 시각과 모델 성능의 객관적 평가 방법 등을 학습합니다.


토픽7: Data Mining & Machine Learning: Naïve Bayes & Text Mining

사전(prior), 사후(posterior), 우도(likelihood) 등 베이지안 접근에 대한 기본 개념을 배우고, 나이브 베이즈 분류기(naive bayes classifier)가 무엇인지 알아보고, 실제 데이터를 통한 분석 결과와 성능 평가 등도 학습합니다. 또한, TF, IDF, TF-IDF, bag of words, N-gram, topic model 등 텍스트 데이터 분석 기법을 배우고, 실제 뉴스 데이터를 통해 주식가격 움직임을 예측하는 예시를 통해 실무적으로 어떻게 활용되는지 학습합니다.

(학습 전략)

텍스트 데이터 마이닝 및 분석 기법의 기본 개념을 배울 수 있습니다. 텍스트 데이터 수집, 가공, 분석, 모델링, 성능 평가 등의 일련의 과정을 실제 뉴스 데이터 등을 통해 학습할 수 있다는 점에서 매우 실용적인 토픽입니다. 자연어 처리의 근간이 되는 개념으로 실무상 활용 범위가 넓다는 점에서 시험 목적 그 이상의 가치를 가지는 토픽이라 생각됩니다.


토픽8: Big Data & Machine Learning: Ethical & Privacy Issues

빅데이터, 기계학습, 인공지능을 비즈니스에 적용하는 과정에서 나타날 수 있는 잠재 위험 요인을 윤리, 개인 사생활 침해, 회사 내부통제 등의 관점에서 살펴봅니다. 금융회사 입장에서 이와 같은 비즈니스를 시작하기 이전, 수행 과정 중 유의해야할 다양한 사항에 대해 배웁니다. 그리고 유럽의 General Data Protection Regulation에 대해서도 배웁니다.

(학습 전략)

이전 토픽들과는 달리 빅데이터, 기계학습, 인공지능 등이 가지는 잠재 위험요인에 대해 배웁니다. 금융회사 관리자 혹은 내부통제 및 감사 등을 담당하는 부서에서 주의 깊게 읽어봐야 할 토픽입니다. 수리적인 내용이 없어 읽기 수월하나 비교적 많은 내용을 암기해야 합니다.


토픽9: Big Data & Machine Learning in the Financial Industry

금융 산업에서 활용되는 빅데이터, 기계학습에 대해 기술한 보고서 및 논문으로 구성됩니다. 총 11개 세부 토픽으로 구성되며, 개별 세부 토픽의 주요 내용은 아래와 같습니다. 세부 토픽은 장문의 보고서 혹은 논문입니다. 공통적으로 논문 abstract를 읽고 무슨 내용인지를 파악하고, 스터디가이드의 키워드와 학습 목표 중심으로 학습하는 것이 효율적입니다. 이유는 학습 목표가 논문에서 말하고자 중심 내용 보다 해당 논문에서 주로 활용한 새로운 통계 기법, 기계학습 알고리즘 및 인공지능 기법에 대한 이론에 집중하고 있기 때문입니다.

(학습 전략)

전반적으로 토픽1~8에서 나온 주요 내용과 공통되는 부분이 많다는 측면에서 토픽9를 공부하면서 토픽1~8의 내용을 복습합니다.

사업자등록번호 105-86-56986 ㅣ 통신판매업신고번호 2005-02554 ㅣ 원격평생교육시설신고 제52호
서울특별시 영등포구 경인로 775 에이스하이테크시티 2동 10층 (주)이패스코리아
대표이사: 이재남 ㅣ 개인정보보호책임자 : 나현철

COPYRIGHT 2003-2020 EPASSKOREA. ALL RIGHTS RESERVED.