Nvidia החדש של כרטיסי Tesla לענות על הצרכים של הגדלת היכולות של שירותי AI - מחשוב - 2019

Anonim

כעת, כאשר נווידיה פנתה לשוק הצרכני עם כרטיסי הגרפיקה העדכניים ביותר שלה, המבוססים על הארכיטקטורה של "פסקל", הפתרונות הבאים בפלטפורמת פסקל של החברה מתייחסים לשוק הרשת העצבית העמוק כדי להאיץ את לימוד המכונה. פתרונות אלה מגיעים בצורה של טסלה P4 חדש ו Tesla P40 כרטיסי מאיץ כדי להאיץ את עומסי העבודה הייצור של השתקפות שבוצעו על ידי שירותים המשתמשים באינטליגנציה מלאכותית.

יש בעצם שני סוגים של כרטיסי מאיץ עבור רשתות עצביות עמוק: אימון והסקת. הראשון צריך לדבר בעד עצמו, להאיץ את האימון של רשת עצבית עמוקה לפני שהוא נפרס בשדה. עם זאת, היקש הוא תהליך של מתן קלט לרשת העצבית העמוקה ואחרי זה לחלץ נתונים המבוססים על קלט זה. זה כולל תרגום דיבור בזמן אמת ו לוקליזציה פנים בתמונות.

לדברי Nvidia, החדש טסלה P4 ו Tesla P40 כרטיסי מאיץ נועדו להסיק לכלול הוראות התערבות מיוחדים המבוססים על 8 סיביות פעולות, מה שהופך אותם 45 פעמים מהר יותר בזמן תגובה מאשר מעבד Xeon E5-2690v4 של אינטל. הם גם מספקים שיפור של 4x מעל הדור הקודם של החברה של "מקסוול" כרטיסי טסלה, M40 ו M4.

החברה הודיעה השבוע במהלך כנס GTC בייג'ינג 2016 כי ה- Tesla P4 מהווה גורם צורה קטן זה אידיאלי עבור מרכזי נתונים. זה 40x יותר אנרגיה יעילה מאשר המעבדים המשמשים להסיק, ו שרת Tesla P4 אחד יכול להחליף 13 שרתים CPU בלבד נבנה עבור עומסי עבודה בווידיאו וידאו. בינתיים, P40 טסלה אידיאלי עבור עומסי עבודה למידה עמוקה, עם שרת המכיל שמונה מאיצים אלה מסוגלים להחליף יותר מ 140 שרתים מבוססי CPU.

לעומת טסלה M40 הקודם, החדש P40 חבילות יותר ליבות CUDA, מהירויות שעון גבוהות יותר, שעון זיכרון מהיר יותר, דיוק אחד גבוה יותר של 12 TFLOPS, ומספר גבוה יותר של טרנזיסטורים ב -12 מיליארד דולר. עם זאת, דרישת הספק (המעטפה התרמית) נשארת זהה, ולכן Nvidia הצליחה להגביר את רמת הביצועים לכל וואט מבלי לאלץ את הכרטיס לדרוש יותר חשמל. אותו הדבר נכון גם עם איטי Ps4 מודל טסלה מדי כאשר לעומת כרטיס Tesla M4 ישנים יותר.

"עם P100 טסלה ועכשיו טסלה P4 ו P40, NVIDIA מציעה רק קצה לקצה פלטפורמת למידה עמוקה עבור מרכז הנתונים, פותח את הכוח העצום של AI עבור מגוון רחב של תעשיות", אמר איאן באק, המנהל הכללי של מחשוב מואץ ב Nvidia. "הם חותכים זמן הכשרה מ ימים לשעות. הם מאפשרים תובנה להיות מופק באופן מיידי. והם מייצרים תשובות בזמן אמת עבור צרכנים שירותים המופעלים על ידי AI. "

Nvidia חשפה את Tesla P100 במהלך הכנס המקומי של GTC 2016 לפני כחמישה חודשים. כרטיס זה הוא אידיאלי עבור האצת אימון רשת עצבית, מתן ביצועים ביצועים של יותר מ 12 פעמים לעומת הדור הקודם Maxwell מבוססי פתרון. שוב, רשתות עצביות צריך להיות מאומן הראשון לפני שהם פרוסים לתוך השדה, ואת כרטיס Tesla החדש מאיץ את התהליך, חיתוך האימון AI למטה מ שבועות עד ימים.

בנוסף לשני כרטיסי Tesla החדשים, Nvidia השיקה גם את TensorRT, ספריה ל"מיטוב מודלים למידה עמוקה לפריסת ייצור ". החברה הציגה גם את ה- NVDidia DeepStream SDK לפענוח וניתוח של עד 93 זרמי וידאו HD. עם זאת, הנה רשימה קצרה של פרטי החומרה עבור שני Nvidia של שני כרטיסים חדשים Tesla כי הם עכשיו avaialble:

טסלה P40טסלה P4
GPUGP102GP104
ליבות קודה3, 8402, 560
שעון בסיס1, 303MHz810MHz
Boost שעון1, 531MHz1, 063MHz
שעון זיכרון GDDR57.2Gbps6Gbps
רוחב אוטובוס זיכרון384 סיביות256 סיביות
סכום GDDR524GB8GB
יחיד דיוק12 TFLOPS5.5 TFLOPS
TDP250 וואט50 עד 75 וואט