CLUE
Future Data Scientist
2023
2022
2021
Dec 21
[Spark/pyspark] pyspark dataframe 명령어 2 (그룹, 윈도우, 파티션) / groupBy, agg, Window, partitionBy, over, collect_list
Dec 12
[Spark/pyspark] pyspark dataframe 명령어 1 / count, printSchema, select, alias, filter, orderBy, withColumnRenamed, drop
Dec 7
[Spark/pyspark] pyspark dataframe 읽기 및 저장 / spark.read.option.csv, wrtie.option.csv
Dec 5
[Git] 협업을 위한 Git branch 및 Pull Request 생성 / Branch, PR
Dec 1
[Linux] 스크린(Screen) 명령어 익히기 / 서버에 jupyter notebook 계속 띄워두기
Nov 29
[Linux] 쉘 스크립트(Shell Script) 작성을 위한 기본 명령어 3 / 인자(args), 반복문(for), 조건문(if), 함수(function)
Nov 25
[Linux] 쉘 스크립트(Shell Script) 작성을 위한 기본 명령어 2 / sh, cp, mv, rm, tar, echo
Aug 29
[Linux] 쉘 스크립트(Shell Script) 작성을 위한 기본 명령어 1 / ls, chmod, vi, cat, df du, env shebang
Aug 29
[Hadoop] 하둡 파일 시스템 (HDFS) 쉘 명령어 정리 / ls, mkdir, put, get, cat, mv, cp, rm, chmod, chown
Aug 16
[Hadoop] MAC OS M1(Big Sur)에서 하둡(Hadoop) 설치하기 / namenode 에러 java.net.ConnectException 및 .zshrc HADOOP PATH 설정
Jul 28
[Python/Paper] 불균형 데이터 샘플링 기법 (Sampling for Imbalanced Data) / SMOTE, ADASYN, SMOTE-Tomek
Jun 21
[Review/Test] 빅데이터분석기사 실기 합격 후기
May 8
[Review/Paper] 블록체인 논문 리뷰 2 with 스마트 컨트랙트 보안 이슈 및 해결 방안
Apr 17
[Review/Test] 빅데이터분석기사 필기 합격 후기 / 2021년 제 2회 빅분기 문제
Apr 2
[Review/Book] R Packages (2nd Edition) R 패키지 만들기의 기본서 리뷰 및 정리 1 with devtools, roxygen2, create_package, 5 package states
Mar 23
[Review/Paper] 블록체인 논문 리뷰 1 with 개인정보 보호 규범
Feb 24
[Python] Kaggle COVID-19 CT image Classification 2 (폐 CT로 코로나 감염 여부 분류) with CNN, Inception V3 (딥러닝 프로젝트 매뉴얼 2)
Feb 23
[Python] Kaggle COVID-19 CT image Classification 2 (폐 CT로 코로나 감염 여부 분류) with OpenCV, ImageDataGenerator, CNN (딥러닝 프로젝트 매뉴얼 1)
Feb 12
[Python] Kaggle Mushroom Data Classification (캐글 버섯 데이터 분류) with 7 Machine Learning methods (머신러닝 프로젝트 매뉴얼)
Feb 8
[Review/Paper] Clustering 논문 리뷰 with 다양한 클러스터링 방법, 비정형 데이터 클러스터링 관련
2020