전체 글 692

ADP기출 (17, 18, 19, 20, 21, 22, 23, 24회)

17회 출처 : https://bigdata-analyst.tistory.com/34 1. 머신러닝(data: Housing data - log1p로 정규화시킴) EDA, Preprocessing 모델링하고 예측 하이퍼파라미터 조절하여 오차 줄이기, 평가지표는 RMAE 2. 시계열분석 및 시각화(data: Covid19 - 일별 확진자수, 일별 완치자수로 데이터 가공 필요) 코로나 위험지수를 만들고, 그 위험지수에 대한 설명을 적고, 위험지수가 높은 국가들 10개를 선정해서 시각화 한국의 코로나 확진자 예측: 선형 시계열모델, 비선형시계열 모델 2개 만들기 3. 통계분석(data: 설문조사 - A~S까지의 그룹이 설문조사에 응답했고 중간에 반대 문항이 들어가 있음) 그룹별 통계치 계산 탐색적 요인분석을 ..

데이터분석 2022.05.15

ROE, ROA, ROIC

1. ROE - Return On Equity : 자기자본이익률 - 투입한 자기자본을 활용해 얼마만큼의 이익을 냈는지 나타내는 수익성 지표 - 투자금 수익률 3. ROA - Return On Asset : 총자산순이익률 - 총자산(자기자본+부채)을 기준으로 얼마나 수익을 냈는지 측정하는 지표 - 부채를 높히면 일시적으로 수익률이 높아 ROE가 높아질 수 있다. 하지만 이는 부도위험을 높임. 따라서 ROA지표를 통해 부채대비 수익률을 확인할 수 있다. 2. ROIC ROIC(투하자본수익률) = 세후 순 영업이익 / 영업투하자본 - Return On Invested Captial : 투하자본수익률 - 영업활동을 위한 자산과 영업활동으로 인한 이익을 가지고 해당 기업의 영업활동 수익성을 나타내는 지표

금융/주식 2022.04.26

매출액, 영업이익, 당기순이익

1. 매출액 - 업체의 활동에서 얻은 금액의 총량 - ex)카페 : 커피, 커피용품등의 상품을 판매한 전체 수익 2. 영업이익 - 매출총이익(매출 - 매출원가) - 판매관리비,일반관리비 - "영업활동"을 통해 얻은 이익 - ex)카페 : 매출액에서 매출원가(원두, 우유, 물, 시럽, 용기)와 판관비(직원급여, 사무실 임대비, 홍보비, 공과금)을 차감하고 남은 금액 3. 당기순이익 - 경상이익(영업이익 + 영업외이익 - 영업외손실 - 법인세) - 영업활동 이외에 일시적이고 비경상적인 활동을 포함 - ex) 카페 : 영업이익에서 영업외 수익(예금이자, 부동산 투자 수익)을 더하고 영업 외 손실(대출이자, 투자손실)과 법인세비용을 차감하고 남은 금액

금융/주식 2022.04.25

재무재표

1. 자본총계 : 나의 돈 2. 부채총계 : 남의 돈(갚아야 하는 돈) 3. 자산총계 = 자본총계 + 부채총계 4. 유동자산 : 현금화 할 수 있는 유동성 높은 자산(현금, 현금성자산, 단기금융상품, 단기대여금, 재고자산) 5. 비유동성자산 : 토지,건물,기계,영업권,저작권,라이센스 => 유동성자산이 낮은 경우, 비유동성자산을 헐값에 팔아야 할 수 있기 때문에 문제가 된다. 따라서 유동성 자산의 비율은 기업의 신용도를 판단하는데 도움이 된다.

금융/주식 2022.04.25

FTP란?

1. 정의 - FTP(File Transfer Protocal)는 TCP/IP 네트워크상의 장치가 파일을 전송할 때 사용하는 규칙. - 인터넷을 둘러볼때는 HTTP, 인스턴스 메시지는 XMPP, 파일을 이동할때는 FTP 2. FTP 서버란? - 파일을 하나의 장치에서 다른 장치로 전송하는 소프트웨어 어플리케이션 - FTP주소를 가지고 있고, FTP를 수신하는 컴퓨터 3. FTP의 원리 - (클라이언트-서버) 프로토콜 : 클라이언트가 파일을 요쳥하면 서버가 요청된 파일을 제공하는 것 - 2개의 기본채널이 필요 : 명령을 내리고 엑세스 권한 전달채널, 2개의 장치간에 파일 데이터를 전송하는 채널 4. SFTP? - FTP에 시큐어 셸(SSH) 데이터 스트림을 통해 보안을 강화한 파일 전송 방법 - 22번 포..

시스템아키텍처의 정의

시스템 아키텍처의 정의 - 하드웨어와 소프트웨어 아키텍처를 기반으로 시스템이 서비스를 제공하기 위한 아키텍처 - 광의의 정의로는 Technical Architecture, Data Architecture, Application Architecture로 구분 - 협의의 정의로는 Technical Architecture를 의미하며 세부적으로 서버, 스토리지, 네트워크, 보안으로 구분 광의의 시스템아키텍처 정의 1. 기술 아키텍처 : 서버, 네트워크, 보안, 하드웨어 구조, 미들웨어의 배포 구조를 정의 2. 데이터 아키텍처 : 데이터의 무결성을 보장하기 위해 정의 3. 응용 아키텍처 : 정보시스템의 소프트웨어 컴포넌트들 간의 관계 및 제약사항 정의 협의의 시스템아키텍처 정의 1. 서버 - 정보시스템의 계산 능..

NoSQL

NoSQL이란 - 기존의 관계형 데이터베이스의 한게를 벗어나 비정형, 초고용량 데이터 처리를 위해 만들어짐 - 쓰기속도에 중점을 둠 - 다수 서버에 데이터 복제,분산,저장 등 수평적 확장이 가능 NoSQL특징 1. 대용량 데이터 처리 : 페타바이터 수준의 데이터 처리 수용 가능 2. 유연한 스키마 사용 3. 저렴한 클러스터 구성 : 다수 서버를 통한 수평적인 확장 및 데이터 복제 및 분산 저장 가능 4. 높은 가용성 제공 5. 탄력성 : 시스템 일부 장애에도 불구하고 시스템에 접근하는 클라이언트, 응용시스템의 다운타임이 없도록 함 6. 질의가능 : 수십 대에서 수천 대 규모로 구성된 시스템에서도 데이터의 특성에 맞게 효율적으로 데이터를 검색/처리 할 수 있음 7. 높은 확장성 NoSQL종류 1. Key-..

DB/[이론] 2022.03.11

ETL (Operational Data Store, Data WareHouse, Data Mart)

ETL 1. 단어뜻 ETL : extraction, Transformation, Loading (데이터의 이동 및 변환) 2. 과정 Operational Data Store(ODS) => Data WareHouse(DW) => Data Mart 3. 정의 데이터에 대한 추가 작업을 위해 다양한 데이터 원천(source)들로 부터 데이터를 추출, 통합한 데이터베이스. 실시간, 실시간 근접, 원자성을 지닌 하위수준 데이터 저장을 위해 설계 4. 단계 (1) 인터페이스 : 다양한 데이터 원천들로부터 데이터를 획득하는 단계. 실시간 근접실시간, OLAP질의를 지원하기 위해 실시간 데이터 복제 기술 사용 (2) 데이터 스태이징 : 트래잭션 데이터들이 추출되어 하나 이상의 스태이징 테이블에 저장되는 단계 (3) 데..

DB/[이론] 2022.03.11

데이터베이스 장애 복구 방법

로그기반 기법 - 로그파일을 이용한 복구 - redo, undo사용 - 느림 검사점(check point) - 로그파일과 검사점을 이용한 복구 - 로그기반보다 상대적으로 복구속도가 빠름 - undo 사용 그림자 페이징 기법 - 그림자 페이지 테이블을 이용한 복구 - undo간단, redo불필요 - 로그 기반 or 검사점 기반과 함께 사용 - 그림자 페이지 테이블 복사, 기록하는데 따른 오버헤드 발생 - 복사 및 백업본에서 복구하므로 복구 속도가 빠름

DB/[이론] 2022.03.10

데이터 복구

데이터복구란? 데이터베이스 운영 도중 예기치 못한 장애가 발생할 경우 데이터베이스 장애 발생 이전으로 일관성과 무결성을 복원하는것 데이터베이스 장애 유형 1. 트랜젝션 장애 - 논리적 오류 : 내부적은 오류로 트랜젝션 완료 불가 - 시스템 오류 : Deadlock 등의 오류 조건으로 활성 트랜잭션을 강제로 종료 2. 시스템 장애 - 전원, 하드웨어, 소프트웨어 등의 고장 - 시스템 장애로 인해 저장 내용이 영향 받지 않도록 무결성 체크 3. 디스크 장애 - 디스크 스토리지의 일부 또는 전체가 붕괴 - 가장 최근의 덤프와 로그를 이용하여 덤프 이후에 완결된 트랜젝션을 재실행 4. 사용자 장애 - 사용자들의 데이터베이스에 대한 이해 부족으로 발생 - DBA가 데이터베이스를 관리하다 발생하는 실수 데이터베..

DB/[이론] 2022.03.10

교착상태

교착상태(Deadlock) 정의 - 다중 트랜잭션 데이터베이스 시스템에서 다수 트랜젝션이 특정 자원의 할당을 무한정 기다리고 있는 상태 - 교착 상태에 있는 트랜젝션은 실행을 끝낼 수 없으며 시스템 자원이 묶여있어서 다른 작업을 시작하는것도 불가능. - 예시 : T1은 T2가 X를 언락하기를 기다리고, T2는 T1이 Y를 언락 하기를 기다리고 있는 상황 교착상태 발생 원인 - 상호 배제 : 프로세스들이 자원을 배타적으로 점유하여 다른 프로세스가 그 자원을 사용하지 못함 - 점유와 대기 : 프로세스가 어떤 자원을 할당받아 점유하고 있으면서 다른 자원을 요구 - 비선점 : 프로세스에 할당된 자원은 사용이 끝날 때 까지 강제로 빼앗을 수 없으며 점유하고 있는 프로세스 자신만 해제가능 - 환형대기 : 프로세스..

DB/[이론] 2022.03.10

동시성 제어

동시성 제어란 - 다중 사용자 환경을 지원하는 데이터베이스 시스템에 여러 트랜젝션들이 성공적으로 동시에 실행될 수 있도록 하는것 - 트랜젝션의 직렬화를 수행(트랜젝션이 동시에 수행되더라도 그 결과가 순차적으로 수행되도록 만듦) - 무결성보장, 공유도 최대, 응답시간 최소, 시스템 활동의 최대 보장 동시성 제어 하지 않을 경우 문제점 - 갱신 손실 : 이전 트렌젝션이 종료하기 전에 다른 트랜젝션이 갱신 값을 덮어 쓰는 경우 - 오손 데이터 읽기 : 트랜젝션의 중간 수행결과를 다른 트랜잭션이 참조 - 모순성 : DB가 일관성이 없는 상태로 남음 - 연쇄복귀 : 복수의 트랜잭션이 데이터 공유 시 특정 트랜잭션이 처리를 취소할 경우 다른 트랜잭션이 처리한 부분에 대해 취소불가능 - 반복할 수 없는 읽기 : ..

DB/[이론] 2022.03.10

[백준]2473 세용액 투포인터

풀이 https://sosoeasy.tistory.com/540 에서 숫자 두개의 특정합을 구했다면 이번문제는 세 숫자를 구한다. 풀이법은 다음과 같다. 1. 제일 왼쪽 숫자(first)를 잡는다 2. first 오른쪽 부분에서 투포인터를 적용한다 first left right -2 6 -97 -6 98 3. 1. first를 전체에 대해서 O(N)번, 2.투포인터 부분이 O(N)이므로 O(N^2)으로 풀린다. (N은 최대 5000이므로) 소스코드 import sys N=int(input()) L=list(map(int,sys.stdin.readline().split())) L.sort() min_sum = 9876543210 ans=[0,0,0] for i in range(N-2): first = ..

알고리즘/search 2022.03.07