본문 바로가기

STUDY/AI

(3)
자연어 처리 프로세스 효과적인 데이터 전처리: 깨끗한 데이터로 시작하는 분석의 첫걸음안녕하세요, 데이터 분석가 여러분! 오늘은 데이터 분석의 핵심이라고 할 수 있는 데이터 전처리 과정에 대해 알아보겠습니다. 깨끗하고 정제된 데이터는 정확한 분석 결과의 기반이 됩니다. 그럼 지금부터 효과적인 데이터 전처리 5단계를 살펴볼까요?1. 데이터 확인첫 번째 단계는 데이터를 꼼꼼히 살펴보는 것입니다. 데이터의 구조, 각 열의 의미, 데이터 타입 등을 파악합니다. Python에서는df.info(),df.describe(),df.head()등의 함수를 활용하면 좋죠.2. 중복 데이터 제거중복된 데이터는 분석 결과를 왜곡시킬 수 있습니다. pandas의drop_duplicates()함수를 사용하여 쉽게 중복을 제거할 수 있습니다.python..
딥러닝 AI 학습 (이미지) # 이미지 처리### 이미지 세팅- 이미지 디렉터리 기준으로 이미지 셋 만들기    - image_dataset_from_directory```bashimport osimport zipfileimport numpy as npimport tensorflow as tfimport matplotlib.pyplot as pltfrom glob import globfrom PIL import Image# 하이터 파라미터 정의num_epochs = 10learning_rate = 0.001dropout_rate = 0.5input_shape = (128, 128, 3)batch_size = 32num_classes = 클래스 수 # 이미지 패스 지정train_img_path ='이미지 경로'valid_img_pat..
Cat-dog 인식 모델 학습(1) AI 학습을 위해 가장 먼저 한 프로젝트는 고양이와 개 사진을 분류하는 CNN 모델을 구축하는 것이다. 데이터 및 기본 코드는 kaggle (https://www.kaggle.com/tongpython/cat-and-dog/data) 활용하였다. 사용 환경 언어: 파이썬 프레임워크: 케라스 구동환경: 구글 colab 1차 분류하는 코드 및 모델 저장, 로드하는 코드까지 완성 깃허브 공유: https://github.com/wogh551/cat_dog_recognize.git wogh551/cat_dog_recognize Ai code. Contribute to wogh551/cat_dog_recognize development by creating an account on GitHub. github.co..