본문 바로가기

728x90
반응형

Programming

파이썬 예외처리 예외(Exception)란? 예상 가능한 예외 또는 예상이 불가능한 예외로 나눌 수 있다. 예상 가능한 예외 예상 불가능한 예외 발생 여부를 사전에 인지할 수 있다 개발자가 반드시 명시적으로 정의해야 한다 예를들어 사용자의 잘못된 입력, 파일이 없는 경우가 있을 수 있다 개발자 실수로 실행 시 발생하는 예외 예를들어 리스트 범위를 넘어가는 값 호출, 정수0으로 나누는 것들이 있다. 예외처리 예외가 발생할 경우 후속 조치 등의 대처가 필요한다. 프로그램도 제품이기 때문에 모든 잘못된 상황에 대해 대처해야 한다. 예외처리 (Exception Handling) 문법 try - except - else - finally try: #예외 발생 가능 코드 except : #예외 발생시 대응하는 코드 else: #예.. 더보기
Black을 이용한 코드 스타일 맞추기 분석가들의 python 코드 스타일은 정말 제각각이다. linting이나 코드 스타일을 맞추는 것에 신경 쓰고 있지 않았는데 제품에 올리고 협업을 하며 코드 스타 일을 맞추는 것의 필요성을 느꼈다. 오늘은 코드 스타일을 자동으로 포매팅해주는 Black을 알아보고자 한다. https://github.com/psf/black GitHub - psf/black: The uncompromising Python code formatter The uncompromising Python code formatter. Contribute to psf/black development by creating an account on GitHub. github.com Black은 "The Uncompromising Code F.. 더보기
[Library] Dask 추가 정보 및 테스트 지난 포스트에 이어 Dask의 추가적인 특징 및 pandas aggregation과 간단히 비교한 내용을 올리고자 한다. [Library] Dask? Spark? 캐글을 진행하며 중용량(?) 데이터(약 16GB ~ 40GB)를 처리하게 되었다. 파일 포맷과 데이터 타입, 값 변환 등의 처리만으로는 부족하다 싶어 대용량 데이터 처리를 위한 도구를 모색하게 되었다. 대 sha-sha-sha.tistory.com 특징 1. 가상 데이터 프레임 pandas dataframe과 비슷한 기능을 제공하지만 모든 데이터가 메모리에 있는 것은 아님 → 하나 이상의 파일 또는 데이터베이스에 존재하는 채로 처리할 수 있는 기능 메모리 크기와 관계 없이 큰 csv 파일을 가상 데이터 프레임으로 로드 또는 비슷한 형식의 여러개.. 더보기
[Library] Dask? Spark? 캐글을 진행하며 중용량(?) 데이터(약 16GB ~ 40GB)를 처리하게 되었다. 파일 포맷과 데이터 타입, 값 변환 등의 처리만으로는 부족하다 싶어 대용량 데이터 처리를 위한 도구를 모색하게 되었다. 대용량 분석을 위해 spark를 많이 쓰고 pyspark를 제공하지만 로컬 분석 환경에서 사용하기에는 환경 구성에 시간을 들인 만큼의 효율이 나지 않을 수도 있다는 우려가 있었다. 또한 데이터 분석가의 필수 도구인 pandas와 numpy사용에 제약이 있다는 단점이 있다. 그렇게 적절한 도구가 없나 찾아 헤매던 중 dask를 알게 되었고 이를 비교한 포스터가 있어 변역하여 정리하고자 한다. https://medium.com/geekculture/dask-or-spark-a-comparison-for-dat.. 더보기
정규표현식 / 파이썬 예제 (re) 분석 또는 개발을 진행하면서 특정 규칙에 해당하는 문자열을 추출해야 할 경우가 가끔씩 생긴다. 자연어 분석을 메인으로 하지 않는다면 그 빈도가 어쩌다 한 번이다 보니 그때그때 정규 표현식 내용 확인 및 예제를 찾아보는데 시간을 들이게 된다. 그 시간을 줄여보고자 정규표현식과 파이썬에서의 적용에 대해 정리한다. 정규식 문법 Meta 문자 정규 표현식에서 사용되는 기호를 뜻함. 표현식에서 내부적으로 특정 의미를 가지는 문자를 말함. 예약어로 이해 ^x : 문자열의 시작. x문자로 시작됨을 의미 p = re.compile('^@') msg = p.search('@ssesaa.') print(msg.string) @ssesaa. x$ : 문자열의 종료. x문자로 종료됨을 의미 p = re.compile('@$'.. 더보기

728x90
반응형