전체 글
[정보처리기사] 실기 정리 ( 2 / 3 )
● 트랜잭션 하나의 논리적 기능을 정상적으로 수행하기 위한 작업의 기본 단위 ● 트랜잭션 특성 원자성 : 트랜잭션이 실행에 실패하면 일관성 : 트랜잭션 실행 전 후가 같아야함 격리성 : 트랜잭션이 실행 중일 때, 다른 트랜잭션이 영향을 미치지 않는 성질 영속성 : 트랜잭션의 결과는 영속적으로 저장되어야 하는 성질 ● 트랜잭션 제어어 ( TCL ) Commit Rollback Checkpoint ● 데이터정의어 ( DDL ) 대상 도메인 : 하나의 속성이 가질 수 있는 원자값들의 집합 스키마 : 데이터베이스의 구조 내부스키마 개념스키마 외부스키마 테이블 : 데이터 저장 공간 뷰 : 하나 이상의 물리 테이블에서 유도되는 가상의 테이블 인덱스 순서 인덱스 : 데이터가 정렬된 순서로 생성되는 인덱스 해시 인덱스..
[정보처리기사] 실기 정리 ( 1 / 3 )
본 자료는 제가 보기 위해 만든 것입니다. 제가 헷갈리는 부분 위주로 정리했습니다. 1. 요구사항 확인 chapter01 - 소프트웨어 개발 방법론 ● 소프트웨어 생명주기(SDLC) 시스템의 요구분석부터 유지보수까지 전 공정을 쳬계화한 절차 ● 소프트웨어 생명주기 모델 프로세스 요구사항 분석 -> 설계 -> 구현 -> 테스트 -> 유지보수 ● 소프트웨어 생명주기 모델 종류 폭포수 모델 가장 오래된 모델로, 각 단계를 확실히 마무리 지은 후 다음 단계로 넘어감 절차 : 타당성 검토 -> 계획 -> 요구사항 분석 -> 설계 -> 구현 -> 테스트 -> 유지보수 프로토타이핑 모델 나선형 모델 위험을 최소화하기 위해 점진적으로 시스템 개발 절차 : 계획 및 정의 -> 위험 분석 -> 개발 -> 고객 평가 반복적..
[앱인벤터 강좌] 나만의 암호 메모장 만들기(암호 모르면 못봐)
나만의 암호 메모장을 만들어 볼 거에요. 저는 강좌식이기에 1개만 메모할 수 있도록 만들었습니다. 바로 영상 보시죠~ 사용영상 영상에 일부러 소리를 안넣어서 보실 때, 어색하실수 잇어요 처음엔 '암호가 안쓰여져있으면 주의'를 일부러 보여줬습니다. 그리고 그 뒤엔, 일부러 암호도 틀려보고~ 초기화도 해보고~ 등등 짧고 굶게 다 보실 수 있어요 디자인 헷갈리시거나 모르시는 부분있으면 댓글 주세요 블록코딩 암호를 저장해줄 변수를 생성해줘요 저는 메모를 1개만 할 수 있게 이미 정한 상태라 암호를 1개만 만들어도 되요 만약에, 메모를 여러개 하고 싶으시다면 변수를 리스트나 딕셔너리 형태로 만드시면 좋을거 같아요 사실 무식한 방법으로 변수를 여러개 낱개로 만드는 방법도 있어요 ㅋㅋ 사실 이게 더 편해요 생성하기 ..
[파이썬] 캐글 타이타닉 EDA
타이타닉 데이터셋을 EDA를 해보고 시각화를 해보는 것을 목표로 해볼 것이다. 타이타닉 데이터셋 사이트 https://www.kaggle.com/c/titanic/data Titanic - Machine Learning from Disaster | Kaggle www.kaggle.com 컬럼 정보 pclass : 객실 등급 survived : 생존 유무 name : 칭호를 포함한 이름 sex : 성별 age : 나이 sibsp : 형제 혹은 부부의 수 parch : 부모, 혹은 자녀의 수 ticket : 탑승권 종류 (각 숫자가 의미하는 바는 데이터를 통해 알 수 있는 것이 없을 수 있습니다.) fare : 지불한 운임 cabin : 객실정보 embarked : 선착장정보 boat : 탈출한 보트가 있다..
[파이썬] 코랩으로 EDA 해보기 (보스턴주택가격)
코랩으로 보스턴주택가격 데이터를 EDA 해볼 것이다. (EDA : 다양한 각도에서 데이터를 분석하는 과정) 데이터셋 다운로드 위 사이트로 들어가서 데이터셋을 다운로드하면 된다. 나는 다운로드한 데이터셋을 구글드라이브에 옮겨서, 코랩으로 불러올 것이다. https://www.kaggle.com/c/house-prices-advanced-regression-techniques House Prices - Advanced Regression Techniques | Kaggle www.kaggle.com 데이터셋 컬럼 요약 구글드라이브 연동 # 구글드라이브 연동 from google.colab import drive drive.mount('/content/drive') 임포트 import pandas as pd ..
[파이썬] 데이터프레임 인덱스 편집
데이터프레임 병합(concat)을 하다보면 인덱스가 꼬이는 경우가 있다. 데이터 자체는 잘 붙였지만, 인덱스가 꼬여있으면 풀어야 한다. 인덱스 편집은 데이터 분석을 위해 필요한 인덱스를 설정하기 위해 필요하다. reset_index() reset_index() 사용 전 인덱스 정보 인덱스의 길이는 40000이다. 하지만, 마지막 인덱스가 19999이다. 이는 인덱스가 꼬여있음이 의심이 되는 부분이다. 꼬인 인덱스 순서 [0,1,2,3,4, ... 19997,19998,19999, 0,1,2,3,4, ... 19997,19998,19999] 0 ~ 19999 + 0 ~ 19999 : 총 길이 40000 concat_df.index reset_index() 사용 # 인덱스리셋 # reset_index() :..
[파이썬] 데이터프레임 병합 merge
분석를 진행하다보면 데이터가 여기저기 분산되어 있는 경우가 생각보다 많다. 조각난 데이터를 분석에 필요한 데이터셋으로 만들기 위해 데이터프레임을 병합해서 사용해야 한다. 한개 이상의 데이터프레임을 병합할 때, 주로 사용하는 함수를 알아보았다. pd.merge(베이스 df, 병합할 df) - df : 데이터프레임 how : 'left' , 'right' , 'inner' , 'outer' left_on : key값이 다른 경우, 베이스 df의 key 설정 right_on : key값이 다른 경우, 병합 df의 key 설정 merge 실습 df 생성 merge_df1 = pd.DataFrame({ '이름': ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', ..
[파이썬] 데이터 분석해보기 (All Lending Club loan data)
All Lending Club loan data 간략 설명 미국 핀테크 회사인 lending club의 대출 데이터베이스이다. 클라우드펀딩과 대출을 결합한 핀테크의 시초라고 부를 수 있는 회사이며, 방대한 양의 대출 정보를 공개하면서 금융정보분석에도 기여한 공이 큰 데이터이다. 2007~2015년 대출 정보 및 개인 정보를 담고 있다. 226만건, 145항목 정보를 담고 있다. 나는 이중 4만건을 추출해서 사용할 것이다. https://www.kaggle.com/datasets/wordsforthewise/lending-club All Lending Club loan data 2007 through current Lending Club accepted and rejected loan data www.ka..
[알고리즘] 자료구조 시각화 사이트
시각화 사이트 visualgo 사이트에 접속한다 Binary Heap을 클릭한다 설명서는 읽어도 되고, 안읽어도 된다 좌측 하단에 보면 "Create(A)-O(NlogN)"을 클릭한다(참고로 최대힙임) "A= 원하는 값을 넣기" 원하는 값을 넣고, Go를 누르면 실행된다 https://visualgo.net/en visualising data structures and algorithms through animation - VisuAlgo VisuAlgo is free of charge for Computer Science community on earth. If you like VisuAlgo, the only "payment" that we ask of you is for you to tell the..
[파이썬] NaN, None, Null 차이 및 제거 방법
3 가지를 정확하게 구분하는 것이 헷갈린다. 하지만, 중요한 건 셋 다 결측치라는 것이며, 데이터 분석을 하는 과정에서 제거를 해야한다는 공통점이다. NaN(Numpy) - NaN이 포함된 연산의 결과는 NaN이 된다 None(Numpy) - Numpy에서 None을 사용하지 말 것 - None은 파이썬 객체이며, Numpy 연산이 불가능하다 - Pandas에서 사용이 가능하다. 하지만, 연산 속도가 느려지고 Numpy 메소드 사용이 불가능하다 - 사용을 권장하지 않는다 - 다른 프로그래밍 언어에서는 Null이다 NaN, None(Pandas) - Pandas에서 None은 nan으로 자동 변경된다 결측치 탐지 - isnull() : null값이 있으면 True, 아니면 False - notnull() ..