관리 메뉴

안까먹을라고 쓰는 블로그

[Python과 텐서플로우를 활용한 딥러닝 기본 향상과정] 2일차 본문

Language/Python

[Python과 텐서플로우를 활용한 딥러닝 기본 향상과정] 2일차

YawnsDuzin 2019. 10. 19. 09:19

 

반응형

http://acornedu.co.kr/incumbent/edu_detail.jsp?seq=77

 

에이콘아카데미 공식홈페이지

취업률 우수기관 에이콘 아카데미,국비지원 무료교육,빅데이터분석,자바개발자,취업전문학원

www.acornedu.co.kr

교육기간 : 10/12, 10/19, 10/26, 11/2, 11/9 (매주 토요일)

교육시간 : 09:30 ~ 17:30 (중식 12:30 ~ 13:30) [총 35시간]

교육장소 : HBI 기술연구소 에이콘아카데미 종로학원 (서울특별시 중구 다동88 동아빌딩15층)

 

 강사 : 전성일


 

문법추가교육

클래스 생성 및 사용

모듈 생성 및 사용

 

선형대수학

대수학 (Algebra)

 1. 일련의 공리들을 만족하는 수학적 구조들의 일반적인 성질을 연구하는 수학의 한 분야

 2. 대수라는 명칭 그대로 수를 대신하여 문자를 사용해 식을 전개하고 방정식을 푸는 방법을

   연구하는 수학 분야

 

선형 <=> 벡터(행렬)

선형함수(or 사상, 연산, 변환)에 대한 대수학으로서, 여기서 선형(linear)은 다음 두 관계식으로 정의된다.

 - 선형함수 : 일차함수, 미분방정식 / 중첩의원리

 - 비선형함수 : 이차함수, 삼각함수, 로그함수

 

행렬과 벡터

벡터

 - 벡터 : 크기와 방향을 가지는 양

 - 스칼라 : 크기만 있고 방향이 없는 양

   - 벡터 : 순서를 가지는 수의 모음 (ex) 시험점수, 판매가격, 측정거리)

   - 리스트 : 순서를 가지는 수의 모음

 - 벡터의 특성

   1. 벡터의 상등 : 두 벡터가 같다는 것은 두 벡터의 각각의 성분이 같다는 의미

   2. 벡터의 덧셈 : 벡터의 덧셈은 차원이 같은 벡터끼리만 가능함.

                        2차원 벡터는 2차원 벡터하고만, 3차원 벡터는 3차원 벡터하고만 덧셈이 가능

   3. 벡터의 덧셈의 성질 ; 교환법칙, 결합법칙  (항등원 영벡터, 역원이 존재)

   5 .벡터의 내적 (Inner Product, Dot Product, Scalar Product)

   6. 벡터와 함수 (동형사상(isomorphism))

 

행렬

 1. 행렬 : 수(벡터)를 직사각형 모양으로 배열한 것 (Row(행), Column(열))

 2. 행렬의 곱 : 벡터의 내적의 확장

 

 

Windows CMD창에서 아래의 명령어 실행

  python -m pip install --upgrade pipC:\Users\yawns>python -m pip install --upgrade pip
Collecting pip
  Downloading https://files.pythonhosted.org/packages/00/b6/9cfa56b4081ad13874b0c6f96af8ce16cfbc1cb06bedf8e9164ce5551ec1/pip-19.3.1-py2.py3-none-any.whl (1.4MB)
    100% |████████████████████████████████| 1.4MB 6.8MB/s
Installing collected packages: pip
  Found existing installation: pip 19.0.3
    Uninstalling pip-19.0.3:
      Successfully uninstalled pip-19.0.3
Successfully installed pip-19.3.1

 

C:\Users\yawns>pip list
Package    Version
---------- -------
pip        19.3.1
setuptools 40.8.0

 

python -m pip install --upgrade

 

Numpy 설치

C:\Users\yawns>pip install numpy
Collecting numpy
  Downloading https://files.pythonhosted.org/packages/e9/dd/a177f27765b1e5f94fa879cbeef61f8807086371d0b6aa232b836d38b78b/numpy-1.17.3-cp37-cp37m-win_amd64.whl (12.7MB)
     |████████████████████████████████| 12.7MB 6.8MB/s
Installing collected packages: numpy
Successfully installed numpy-1.17.3

 

C:\Users\yawns>pip list
Package    Version
---------- -------
numpy      1.17.3
pip        19.3.1
setuptools 40.8.0

 

https://numpy.org/devdocs/user/quickstart.html

 

Quickstart tutorial — NumPy v1.18.dev0 Manual

NumPy provides familiar mathematical functions such as sin, cos, and exp. In NumPy, these are called “universal functions”(ufunc). Within NumPy, these functions operate elementwise on an array, producing an array as output. See also all, any, apply_along_a

numpy.org

 

 

 

확률 통계

확률 - 오랜기간동안 겨엄적으로 쌓아온 확률현상에 대한 경험적 인식을 바탕으로 이론화 수학분야

통계 - 자료를 수집한 뒤 분석, 해석 및 표현을 다루는 수학의 분야 부분을 분석해서 전체를 추론하는 학문

 - 표본공간 (Sample Space) - 통계적 실험에서 발생가능한 모든 결과들의 집합

  Ex) 2개의 동전을 던지는 실험에서 앞면과 뒷면이 나오는 표본공간

       - 앞앞, 앞뒤, 뒤앞, 뒤뒤

  Ex) 3개의 동전을 던지는 실험에서 앞면과 뒷면이 나오는 표본공간

       - 앞앞앞, 앞앞뒤, 앞뒤앞, 뒤앞앞, 앞뒤뒤, 뒤앞뒤, 뒤뒤앞, 뒤뒤뒤

 - 사건 (Event) - 표본공간에서 특정한 조건에 만족하는 결과를 모아 놓은 집합, 사건은 반드시 표본 공간의 부분 집합임.

      - 사건의 종류 : 전사건, 공사건, 여사건, 합사건, 곱사건, 배반사건

 

 

경우의 수에 대한 공식 (하나 씩 한번 더 알아보자)

 - 순열 - 서로 다른 n개의 원소 중에서 r개를 뽑아 나열하는 방법의 수를 순열이라고 한다, (비복원추출)

     - 순열 공식 알아보기!!!!

 - 중복순열 - 서로 다른 n개의 원소 중에서 중복이 허락될때 나열하는  방법의 수를 중복순열이라고 한다, (복원추출)

 - 동자순열

 - 원순열

 

- 조합 - 7개의 색깔을 가진 구슬이 주머니 안에 있는 경우 이 주머니에서 구슬 3개를 꺼내서 일렬로 나열했을 때

           순서를 무시하고 나열하는 경우의 수

- 확률 - 모든 사건의 경우의 수에 대한 "특정한 사건이 발생한 빈도수"의 비율

           P(A) = "특정한 사건이 발생한 빈도 수" / "모든 사건의 경우의 수"

          문제) 빨간색 공 5개, 초록색 공 3개가 들어있는 주머니에서 공 3개를 임의로 꺼낼때, 초록색 공이 2개 포함될

                 확률을 구하시오.

 

        한개의 공이 뽑힐 확률 : 1/8 - 12.5%

        초록 공이 나올 확률 : 3/8 - 37.5%

 

        "빨간색공5개중 1개를 뽑는 경우의 수" * "초록색 공을 3개중에 2개를 뽑는 경우의 수"

         / "8개의 공 중에서 3개를 뽑는 경우의 수" = (5c1*3c2) / 8c3 

          (((5 * 4) / 1) * ((3 * 2) / 2))  / ((8 * 7) / 3) = ((20) * (3.0)  / (18.666666666666668)

        3.214285714285714

     

확률의 콤비네이션 계산 식

5 C 2 = (5 ×4) ÷ 2 = 10
10 C 2 = (10 ×9) ÷ 2 = 45
100 C 2 = (100 ×99) ÷ 2 = 4950
25 C 2 = (25 ×24) ÷ 2 = 300

 

  - 조건부 확률 - 한 사건(사건 A)이 일어났다는 전제 하에서 다른 사건(사건 B)이 일어날 확률

                       한 사건 A가 발생했다는 전제 하에서 다른 사건 B가 발생할 확률을 "조건부 확률" 이라고 한다.

 - 확률의 곱셈정리

 

Q1. 52장으로 구성된 카드가 있다. 이중 임의로 2장을 뽑는다. 이때 사건 A를 첫번째에 하트는 뽑는 경우라고 하고, 두 번째 뽑은 카드가 빨간색이 나오는 경우라 할때 조건부 확률 P(A|B) 와 P(B|A)를 구하시오.

 

Q2. 흰공3개와 검은공 2개가 들어있는 주머니가 있다 하나씩 차례로 두개의 공을 꺼내는 과정에서 첫번째 공이 검은 색 이었을때, 두번 째 꺼낸 공도 검은색일 확률을 구하시오.

 - 첫 번째 꺼낸 공이 검은색인 사건 A

 - 두번째 꺼낸 공이 검은 색인 사건 B

 

Q3. 피아노 3명, 바이올린 5명, 첼로 6명으로 구성된 음악단 14명 중에 임의로 뽑은 3명 모두 같은 악기 일때

그 악기가 피아노나 첼로일 확률은??

 

확률변수 - 표본공간의 각 원소에 하나의 실수를 대응시킬때 이 실수를 확률변수(random varialble)"라고 합니다.

               따라서 확률변수는 함수다.

기대값 - 어떤 확률을 가진 사건을 무한히 반복했을 경우, 얻을 수 있는 값의 평균으로서 기대할 수 있는 값 = 평균

확률변수의 분산 - 확률변수의 분산은 자료의 "분포(disstribution)"가 평균(기대값)으로부터 얼마나 산포되어 있는지를

표현, 즉 어떤 확률변수가 평균으로부터 얼마나 떨어져 있는지를 숫자로 표현한 것.

    - 편차(deviation) : 확률변수 x에서 기대 값을 뺀값

          - 모든 편차의 합은 0 : 관측치 x를 무한 반복하면 기대값 E(X)에 수렴한다.

          - 제곱을 해서 음수를 없앰

     - 확률변수의 표준편차(standard deviation) - 분산에 제곱근을 붙인 값

 

공분산 - 두 개의 확률변수의 관계를 보여주는 값으로, 확률변수 X와 Y에 대해 X가 변할 때 Y가 변하는 정도를 나타내는 값, "공분산"은 두 확률변수 X와 Y가 같이 변하는 정도를 나타내는 값

상관관계 - 공분산, 상관계수 구 변수의 연관성을 표현하는 값.

     - 공분산 : 측정 단위에 영향

     - 상관계수 : 측정단위에 영향을 받지 않는다. (각 각의 표준편차로 나누어 준다.)

 

상관계수 - 공분산, 상관계수 주 변수의 연관성을 표현하는 값

  - 공분산 : 측정단위에 영향

  - 상관계수 : 측정단위에 영향을 받지 않는다. 각각의 표준편차로 나누어 준다.

      1이면 완전비례, -1이면 완전 반비례, 0이면 관련이없음(독립)

 

회귀분석 : 관찰된 자료의 변수들 사이에서 나타나는 "경향성(tendency)" 또는 "의존성(dependency)" 을

              수학적으로 분석 - 이래에 발생할 일들의 예측(prediction)이 가능

  - 회귀분석은 둘 또는 그 이상의 변수들 간의 의존관계를 파악함으로써 어떤 특정한 변수(종속변수)의 값을 다른 한개       또는 그 이상의 변수(독립변수)들로부터 설명하고 예측하는 통계학의 한분야이다.

   - 회귀계수 찾기

     - 적합회귀선 : 관찰된 자료를 가장 잘 표한하는 직선 - 이 직선을 만들 수 있는 회귀계수 찾기

 

오차제곱법 - 회귀계수는 잔차 제곱의 합이 최소가 되도록 해야 한다.

   - 잔차 제곱의 합이 최소가 되는 값을 구하려는 미분을 이용

   - 적합회귀선 : 관찰된 자료를 가장 잘 표현하는 직선 

                       이 직선을 만들 수 있는 회귀계수 찾기 : 잔차를 최소화하는 기울기와 y절편 찾기

 

 

 

 

[번역] 머신러닝 속 수학

https://mingrammer.com/translation-the-mathematics-of-machine-learning/

 

[번역] 머신러닝 속 수학

The Mathematics of Machine Learning을 번역한 글입니다. 지난 몇 달 간, 나는 데이터 과학의 세계로 모험하고 머신러닝 기술을 사용하여 통계적 규칙성을 조사하고 완벽한 데이터

mingrammer.com

 

데이터 사이언스 스쿨 - 파이썬 및 데이터처리관련 수학, 함수등..............

https://datascienceschool.net/view-notebook/39569f0132044097a15943bd8f440ca5/

 

Data Science School

Data Science School is an open space!

datascienceschool.net

 

 

 

 

numppy.dot  내가 이해할려고 정리 - (2,3)배열 과 (3,2)배열

 

 

 

 

Neural Networks

1. 미분/적분

2. 선형대수

3. 확률/통계

4. 회귀분석

 

 

http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791162240472&orderClick=LIZ&Kc=

 

처음 배우는 데이터 과학

프로그래밍 경험은 많지만 통계나 데이터 분석을 잘 모르...

www.kyobobook.co.kr

http://news.kyobobook.co.kr/comma/readITView.ink?orderclick=JAc&sntn_id=14142&Kc=KDBLCNbooknews

 

에이지 오브 머신러닝 | READ IT | 연재 - 인터넷 교보문고

쏟아지는 머신러닝,딥러닝 책들… 어디서 어떻게 시작해야 할까?안녕하세요. 『밑바닥부터 시작하는 딥러닝』을 번역한 개앞맵시 이복연입니다.갑작스레 이 책을 주제로 칼럼을 써달라는 요청을 받았는데, 출간된 지 벌써 1년 반이 다 되어가고 이미 많은 분이 읽어주신 뒤라 마땅히 쓸 말이 떠오르지 않았습니다. 그래서 생각을 달리해, 범람하는 머신러닝/딥러닝 책들의 교통정리를 시도해볼까 합니다. 아마도 이쪽이 더 도움이 되겠지요?먼저 『밑바닥부터 시작하는 딥러닝』을

news.kyobobook.co.kr

 

 

 

2. Linear Regression

 2.1 Simple Linear Regression 기초

 2.2 Gradient Descent 알고리즘

 2.3 Multi-variable linear regression

 

 

빅데이터 학습에서 중요한 부분은,,

데이터 전처리, 처리모델정의, 

반응형
Comments