데이터시럽

  • 홈
  • 태그
  • 방명록

Nvidia PlatFrom/TensorRT 1

[TensorRT] Tensort 기본개념

AI 서비스를 운영하는데 있어 비용적 측면은 매우 중요한 사항이 아닐 수 없다. AI의 성능은 성능적으로 매우 빠르게 증대되며, 그에 따라 VRAM과 전력소모와 같은 요구사항 스펙이 늘어날 수 밖에 없다. 이것을 상쇄시키기에 비싼 Nvidia Gpu를 많이 사용하고 싶지만, 그 비용은 Nvidia 주식가격(오늘 이 제일 쌉니다 ㅎㅎ) 만큼 비용이 많이 들것이다. 따라서 이 비용을 절감하기 위해서 효율적으로 서비스를 운영하기 위해 모델의 경량화는 필수일 것이다. 엔비디아에서는 이러한 Gpu를 사용하는 기기에서는 최적화 해주는 기능을 제공해주며, 이를 적극적으로 도입할 필요가 있다. TF-TRT(TensorFlow)나 torch2trt(Pytorch) 등을 딥러닝 프레임워크에서 지원해 주지만 최신의 모델이나..

Nvidia PlatFrom/TensorRT 2024.02.11
1
더보기
반응형
프로필사진

사회복지사로 3년 간 근무 하고, 개발자로 전향하면서 배웠던 내용을 정리하는 블로그 입니다.

  • 분류 전체보기 (218)
    • 경기도 인공지능 개발 과정 (78)
      • 과제 (9)
      • R (19)
      • SQL (6)
      • Python (38)
      • HTML & CSS (0)
      • javascript (4)
      • 클라우드 (1)
    • 파이썬 이것저것 (78)
      • 크롤링 (5)
      • 코테준비 (31)
      • 파이썬 데이터분석 (6)
      • 파이썬 머신러닝 (4)
      • 파이썬 딥러닝 관련 (27)
      • 파이썬 기초 (1)
      • 파이썬 백엔드 (4)
    • 태블로 이것저것 (1)
    • SQL 이것저것 (18)
    • 관련 이것저것 (21)
      • Git (4)
      • Airflow (1)
      • docker (5)
      • kafka (1)
      • 자격증 (1)
      • IT Book 리뷰 (8)
      • Linux (1)
    • Nvidia PlatFrom (2)
      • Triton Inference Server (1)
      • Deepstream (0)
      • TensorRT (1)
    • C# 이것저것 (15)
      • C# 기초 (4)
      • WinForm (1)
      • 초보자를 위한 C#200제 (5)
      • C# 디자인패턴 (5)

Tag

텐서플로, 파이썬, docker, 딥러닝 기초, 파이썬 백엔드, C# 디자인패턴, 디자인패턴, 코테, LLM, 코테준비, Python, SQL, 딥러닝, 제이펍, C#, yolov5, gpt 무료, 프로그래머스, YOLO, Flask,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/05   »
일 월 화 수 목 금 토
1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

티스토리툴바