모델 논문, 학습5 모델 GITHUB참고 모델 ViT를 공부하다가 모델단에서 돌려보는 코드를 실험하려고 하는데 공식사이트에서 참고해서 하는 방법을 기록해두려고 한다. 예시 깃허브) huggingface/transformers: 🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX. GitHub - huggingface/transformers: 🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX.🤗 Transformers: State-of-the-art Machine Learning for Pytorch, TensorFlow, and JAX. - hug.. 2025. 2. 23. Vision Transformer(ViT) 논문 리뷰(직역) ▶ 논문 사이트 [ https://arxiv.org/pdf/2010.11929.pdf ] Transformer는 NLP에서만 다룬다고 생각을했었는데 VISION에서도 Transformer이나왔다고 한다.사실 AI는 가장 빠르게 변화하는 분야이기때문에 좀 많이 찾아보고 해야되는데 취직이 먼저아닐까하는 생각때문에 못했던것같다. 최신모델을 다뤄보면서 가장 대중적으로 사용하는 모델도 관심을 갖기 위해서 Vision Transformer을 리뷰해 보려고 한다.Visual Transformer (ViT) - 이미지인식을 위해서 Transformer 모델을 적용한 구조입니다.- 기존 CNN 대신 이미지를 패치(조각)으로 나누고 이를 Transformer에 입력하는 방식으로 작동합니다.논문리뷰Transformer구조.. 2025. 2. 18. YOLO TRACKER 문서 및 실험&구현해보기 YOLO TRACKER이란? Ultralytics YOLO문서에 확인이 됩니다.다중객체추적 Ultralytics YOLO이라고불리는것같습니다.Ultralytics Tracker의 출력은 표준 객체 감지와 일치하긴 하지만 객체id를 따로 부여합니다.이것을 통해 스트림에서 객체를 쉽게 추적하고 후속 분석까지지 진행할 수 있습니다. 너 이거 왜 공부하는데? 사실 지금 프로젝트를 진행하면서 yolo pose를 사용하고있는데 사람이 1명밖에 없음에도 불구하고 2명으로 잡는 현상이 나타나고 있습니다.그래서 이 부분을 해결하기 위해서 1명만 잡는걸 어떻게 해야할까? 라는 고민을 하다가 yolopose + tracker까지 하면 보다 잘 잡을 것 같아서 트래커도 공부하게 되었습니다.https://docs.ultral.. 2024. 12. 24. You Only Look Once:Unified, Real-Time Object Detection YOLO(You Only Look Once)🟨 Abstract욜로에 대해서 소개합니다.객체탐지를 위한 새로운 접근 방식인 YOLO입니다.기존의 객체탐지는 분류를 번형하여 탐지를 수행하는 방식에 의존하지만YOLO는 객체 탐지를 공간적으로 분리된 바운딩 박스와 관련된 클래스 확률로의 회귀문제로 정의합니다.하나의 신경망은 전체 이미지를 한번 평가하고 바운딩박스 , 클래스 확률을 직접 예측합니다.전체 탐지 파이프라인이 단일 네트워크로 구성되어 있어서 탐지 성능을 기준으로 처음부터 끝까지 최적화할 수 있습니다. 아키텍쳐로보면 통합되어있고 매우 바릅니다.기본 YOLO는 초당 45프레임으로 실시간 처리합니다.좀 더 작은 모델인 FAST YOLO는 초당 155프레임이라는 속도로 이미지 처리하고 다른 실시간 탐지기보다.. 2024. 12. 3. [논문] alexnet 알렉스넷 논문 위는 영어논문 아래는 한국어로 번역된 논문이다.ImageNet Classification with Deep Convolutional Neural Networks 개요우리는 ImeageNet LSVRC-2010대회에서 120만개의 고해상도 이미지를 1000개의 다른 클래스로 분류하기 위해 대규모의 심층 합성곱 신경망을 훈련했습니다. 테스트데이터에서 우리는 이전 최첨단 기술보다 상당히 나은 35.7%와 17.0%의 상위 1및 상위 5 오류율을 달성했습니다.6000만개의 매개변수와 650,000개의 뉴런을 가진 신경망은 5개의 합성곱계층으로 구성되어있으며 그 중 일부는 최대 풀링계층으로 이어지고 3개의 완전 연결 계층에는 최종 1000방향 SOFTMAX가 있습니다. 훈련을 더 빠르게 하기 위해 우리는 포화되지 .. 2024. 10. 16. 이전 1 다음