این مقاله حاوی یک مرجع سریع و شرح مفصلی از سهمیهها و محدودیتهای سرویس گفتار در خدمات شناختی Azure است. این اطلاعات برای تمام سطوح قیمت گذاری خدمات اعمال می شود. همچنین حاوی برخی از بهترین روشها برای جلوگیری از خفه شدن درخواست است.
مرجع سهمیه ها و محدودیت ها
بخشهای زیر راهنمای سریع سهمیهها و محدودیتهایی را که برای سرویس گفتار اعمال میشود، در اختیار شما قرار میدهد.
سهمیه ها و محدودیت های گفتار به متن در هر منبع
در جداول زیر، پارامترهای بدون ردیف قابل تنظیم برای همه سطوح قیمت قابل تنظیم نیستند.
رونویسی آنلاین
میتوانید از رونویسی آنلاین با Speech SDK یا گفتار به نوشتار REST API برای صدای کوتاه استفاده کنید.
سهمیه، سهم | رایگان (F0) 1 | استاندارد (S0) |
---|---|---|
محدودیت درخواست همزمان - نقطه پایانی مدل پایه | 1 | 100 (مقدار پیش فرض) |
قابل تنظیم | شماره 2 | بله 2 |
محدودیت درخواست همزمان - نقطه پایانی سفارشی | 1 | 100 (مقدار پیش فرض) |
قابل تنظیم | شماره 2 | بله 2 |
رونویسی دسته ای
سهمیه، سهم | رایگان (F0) 1 | استاندارد (S0) |
---|---|---|
محدودیت گفتار به نوشتار REST API | برای F0 موجود نیست | 300 درخواست در دقیقه |
حداکثر اندازه فایل ورودی صوتی | N/A | 1 گیگابایت |
حداکثر اندازه حباب ورودی (به عنوان مثال، می تواند بیش از یک فایل در یک بایگانی فشرده داشته باشد). به محدودیت اندازه فایل از ردیف قبل توجه کنید. | N/A | 2. 5 گیگابایت |
حداکثر اندازه ظرف حباب | N/A | 5 گیگابایت |
حداکثر تعداد حباب در هر ظرف | N/A | 10000 |
حداکثر تعداد فایل در هر درخواست رونویسی (زمانی که از چندین URL محتوا به عنوان ورودی استفاده می کنید). | N/A | 1000 |
سفارشی سازی مدل
سهمیه، سهم | رایگان (F0) 1 | استاندارد (S0) |
---|---|---|
محدودیت API REST | 300 درخواست در دقیقه | 300 درخواست در دقیقه |
حداکثر تعداد مجموعه داده گفتار | 2 | 500 |
حداکثر اندازه فایل مجموعه داده آکوستیک برای وارد کردن داده | 2 گیگابایت | 2 گیگابایت |
حداکثر اندازه فایل مجموعه داده زبان برای وارد کردن داده | 200 مگابایت | 1. 5 گیگابایت |
حداکثر اندازه فایل مجموعه داده تلفظ برای وارد کردن داده ها | 1 کیلوبایت | 1 مگابایت |
حداکثر اندازه متن زمانی که از پارامتر متن در درخواست Models_Create API استفاده می کنید | 200 کیلوبایت | 500 کیلوبایت |
1 برای ردیف قیمت گذاری رایگان (F0)، کمک هزینه ماهانه را در صفحه قیمت گذاری نیز ببینید. 2 توضیحات اضافی، بهترین شیوه ها و دستورالعمل های تنظیم را ببینید.
سهمیه ها و محدودیت های تبدیل متن به گفتار در هر منبع گفتار
در جداول زیر، پارامترهای بدون ردیف قابل تنظیم برای همه سطوح قیمت قابل تنظیم نیستند.
عمومی
سهمیه، سهم | رایگان (F0) 3 | استاندارد (S0) |
---|---|---|
حداکثر تعداد تراکنش ها در بازه زمانی مشخص | ||
API بلادرنگصداهای عصبی از پیش ساخته شده و صداهای عصبی سفارشی. | 20 تراکنش در 60 ثانیه | 200 تراکنش در ثانیه (TPS) (مقدار پیشفرض) |
قابل تنظیم | شماره 4 | بله 5، تا 1000 TPS |
سهمیه های خاص HTTP | ||
حداکثر طول صدا تولید شده در هر درخواست | 10 دقیقه | 10 دقیقه |
حداکثر تعداد کل برچسب ها و متمایز در SSML | 50 | 50 |
سهمیه های خاص Websocket | ||
حداکثر طول صدا تولید شده در هر دور | 10 دقیقه | 10 دقیقه |
حداکثر تعداد کل برچسب ها و متمایز در SSML | 50 | 50 |
حداکثر اندازه پیام SSML در هر نوبت | 64 کیلوبایت | 64 کیلوبایت |
صدای عصبی سفارشی
سهمیه، سهم | رایگان (F0) 3 | استاندارد (S0) |
---|---|---|
حداکثر تعداد تراکنش در ثانیه (TPS) | برای F0 موجود نیست | به ژنرال مراجعه کنید |
حداکثر تعداد مجموعه داده ها | N/A | 500 |
حداکثر تعداد آپلود مجموعه داده همزمان | N/A | 5 |
حداکثر اندازه فایل داده برای وارد کردن داده در هر مجموعه داده | N/A | 2 گیگابایت |
آپلود فایل های صوتی طولانی و بدون اسکریپت | N/A | آره |
حداکثر تعداد آموزش های مدل همزمان | N/A | 3 |
حداکثر تعداد نقاط پایانی سفارشی | N/A | 50 |
محدودیت درخواست همزمان برای صدای عصبی سفارشی | ||
مقدار پیش فرض | N/A | 10 |
قابل تنظیم | N/A | بله 5 |
ابزار ایجاد محتوای صوتی
سهمیه، سهم | رایگان (F0) | استاندارد (S0) |
---|---|---|
حجم فایل | 3000 کاراکتر در هر فایل | 20000 کاراکتر در هر فایل |
صادرات به کتابخانه صوتی | 1 کار همزمان | N/A |
شرح مفصل، تعدیل سهمیه، و بهترین شیوه ها
قبل از درخواست افزایش سهمیه (در صورت لزوم) ، اطمینان حاصل کنید که لازم است. سرویس گفتار از فناوری های خودکار استفاده می کند تا منابع محاسباتی مورد نیاز را در حالت تقاضا وارد کند. در عین حال ، سرویس گفتار سعی می کند با حفظ مقدار بیش از حد ظرفیت سخت افزاری ، هزینه های خود را کم نگه دارد.
بیایید به یک مثال نگاه کنیم. فرض کنید برنامه شما کد پاسخ 429 را دریافت می کند ، که نشان می دهد درخواست های زیادی وجود دارد. برنامه شما این پاسخ را دریافت می کند حتی اگر حجم کار شما در محدوده ای باشد که توسط سهمیه ها تعریف شده و مرجع را محدود می کند. محتمل ترین توضیح این است که سرویس گفتار به تقاضای شما رسیده و هنوز به مقیاس مورد نیاز نرسیده است. بنابراین این سرویس بلافاصله منابع کافی برای ارائه درخواست ندارد. در بیشتر موارد ، این حالت لرزان گذرا است.
بهترین روشهای کلی برای کاهش فشار در هنگام خودکار سازی
برای به حداقل رساندن مسائل مربوط به پرتاب ، استفاده از تکنیک های زیر ایده خوبی است:
- منطق مجدد را در برنامه خود پیاده سازی کنید.
- از تغییرات شدید در بار کار خودداری کنید. به تدریج بار کار را افزایش دهید. به عنوان مثال ، بیایید بگوییم برنامه شما از متن به گفتار استفاده می کند و حجم کار فعلی شما 5 TPS است. ثانیه بعدی ، شما بار را به 20 tps افزایش می دهید (یعنی چهار برابر بیشتر). سرویس گفتار بلافاصله برای تحقق بار جدید ، مقیاس گذاری را شروع می کند ، اما در طی یک ثانیه قادر به مقیاس نیست. برخی از درخواست ها کد پاسخ 429 را دریافت می کنند (درخواست های زیادی).
- الگوهای افزایش بار مختلف را آزمایش کنید. برای اطلاعات بیشتر ، به مثال الگوی بار کار مراجعه کنید.
- منابع سرویس گفتار اضافی را در مناطق مختلف ایجاد کنید و بار کار را بین آنها توزیع کنید.(ایجاد چندین منابع خدمات گفتاری در همان منطقه بر عملکرد تأثیر نمی گذارد ، زیرا تمام منابع توسط همان خوشه با پس زمینه ارائه می شوند).
بخش های بعدی موارد خاص تنظیم سهمیه را شرح می دهد.
گفتار به متن: محدودیت درخواست همزمان رونویسی را افزایش دهید
به طور پیش فرض ، تعداد درخواست های همزمان در مدل پایه به 100 در هر منبع محدود می شود و 100 در هر نقطه پایانی سفارشی در مدل سفارشی. برای ردیف قیمت گذاری استاندارد ، می توانید این مقدار را افزایش دهید. قبل از ارسال درخواست ، اطمینان حاصل کنید که با مطالب مورد بحث در این مقاله آشنا هستید ، مانند بهترین روشها برای کاهش فشار.
اگر از مدل های سفارشی استفاده می کنید ، توجه داشته باشید که یک منبع سرویس گفتار ممکن است با بسیاری از نقاط پایانی سفارشی که میزبان بسیاری از استقرارهای مدل سفارشی هستند ، همراه باشد. هر نقطه پایانی سفارشی دارای حد پیش فرض درخواست های همزمان (100) تنظیم شده توسط ایجاد است. اگر نیاز به تنظیم آن دارید ، باید تنظیم هر نقطه پایانی سفارشی را به طور جداگانه انجام دهید. توجه داشته باشید که مقدار حد درخواست های همزمان برای مدل پایه یک منبع هیچ تاثیری در نقاط پایانی سفارشی مرتبط با این منبع ندارد.
افزایش حد درخواست های همزمان به طور مستقیم بر هزینه های شما تأثیر نمی گذارد. سرویس گفتار از یک مدل پرداخت استفاده می کند که نیاز به پرداخت هزینه فقط برای آنچه استفاده می کنید. این حد مشخص می کند که قبل از شروع گاز درخواست های شما ، چقدر می تواند مقیاس را مقیاس کند.
محدودیت های درخواست همزمان برای مدلهای پایه و سفارشی باید به طور جداگانه تنظیم شود.
شما قادر به دیدن مقدار موجود پارامتر محدودیت درخواست همزمان در پورتال لاجورد ، ابزارهای خط فرمان یا درخواست های API نیستید. برای تأیید مقدار موجود ، یک درخواست پشتیبانی لاجورد ایجاد کنید.
ظروف گفتار نیازی به افزایش حد درخواست همزمان ندارند ، زیرا ظروف فقط توسط CPU سخت افزاری که در آنها میزبان هستند محدود می شوند. با این حال ، ظروف گفتار محدودیت های ظرفیت خاص خود را دارند که باید در نظر گرفته شود. برای اطلاعات بیشتر ، به سؤالات متداول در ظروف گفتار مراجعه کنید.
اطلاعات لازم را آماده کنید
- برای مدل پایه:
- شناسه منابع گفتار
- منطقه
- منطقه
- شناسه نقطه پایانی سفارشی
نحوه دریافت اطلاعات برای مدل پایه:
- به پورتال لاجورد بروید.
- منبع سرویس گفتار را انتخاب کنید که می خواهید محدودیت درخواست همزمانی را افزایش دهید.
- از گروه مدیریت منابع ، Properties را انتخاب کنید.
- مقادیر قسمتهای زیر را کپی و ذخیره کنید:
- شناسه منابع
- مکان (منطقه پایانی شما)
نحوه دریافت اطلاعات برای مدل سفارشی:
- به پورتال استودیوی گفتار بروید.
- در صورت لزوم وارد سیستم شوید و به گفتار سفارشی بروید.
- پروژه خود را انتخاب کنید و به استقرار بروید.
- نقطه پایانی مورد نیاز را انتخاب کنید.
- مقادیر قسمتهای زیر را کپی و ذخیره کنید:
- منطقه خدمات (منطقه پایانی شما)
- شناسه نقطه پایانی
درخواست پشتیبانی را ایجاد و ارسال کنید
با ارسال درخواست پشتیبانی ، افزایش حد درخواست های همزمان برای منابع خود را آغاز کنید ، یا در صورت لزوم حد فعلی را بررسی کنید. در اینجا چگونه:
- اطمینان حاصل کنید که اطلاعات لازم را در بخش قبلی ذکر کرده اید.
- به پورتال لاجورد بروید.
- منبع سرویس گفتار را انتخاب کنید که می خواهید محدودیت درخواست همزمانی را افزایش دهید (یا برای بررسی).
- در گروه پشتیبانی + عیب یابی ، درخواست پشتیبانی جدید را انتخاب کنید. یک پنجره جدید با اطلاعات جمع شده خودکار در مورد اشتراک لاجورد و منابع لاجورد شما ظاهر می شود.
- به طور خلاصه ، آنچه را که می خواهید شرح دهید (به عنوان مثال ، "افزایش درخواست همزمانی گفتار به متن").
- در نوع مشکل ، سهمیه یا اشتراک را انتخاب کنید.
- در زیرگروه مشکل ، یا انتخاب کنید:
- سهمیه یا درخواست های همزمان برای افزایش درخواست افزایش می یابد.
- سهمیه یا اعتبار سنجی استفاده برای بررسی حد موجود.
- Next: Solutions را انتخاب کنید. با ایجاد درخواست بیشتر ادامه دهید.
- در برگه جزئیات ، در قسمت توضیحات ، موارد زیر را وارد کنید:
- توجه داشته باشید که درخواست در مورد سهمیه گفتار به متن است.
- مدل پایه یا سفارشی را انتخاب کنید.
- اطلاعات مربوط به منابع لاجورد که قبلاً جمع آوری کرده اید.
- هر اطلاعات مورد نیاز دیگر
- در برگه بررسی + ایجاد ، ایجاد را انتخاب کنید.
- توجه داشته باشید شماره درخواست پشتیبانی در اعلان های پورتال لاجورد. به زودی در مورد درخواست خود با شما تماس گرفته می شود.
نمونه ای از الگوی بار کاری بهترین تمرین
در اینجا یک نمونه کلی از یک رویکرد خوب برای استفاده وجود دارد. این فقط به عنوان یک الگوی است که می توانید در صورت لزوم برای استفاده خود تنظیم کنید.
فرض کنید که یک منبع سرویس گفتار دارای حد درخواست همزمان است تا 300 نفر تنظیم شود. بار کار را از 20 اتصال همزمان شروع کنید و بار را با 20 اتصال همزمان در هر 90-120 ثانیه افزایش دهید. پاسخ های سرویس را کنترل کنید و در صورت دریافت بیش از حد درخواست ها ، منطقی را که به عقب می افتد (کاهش بار) را پیاده سازی کنید (کد پاسخ 429). سپس ، بار را در یک دقیقه دوباره امتحان کنید و اگر هنوز کار نمی کند ، در دو دقیقه دوباره امتحان کنید. برای فواصل از الگوی 1-2-4-4 دقیقه استفاده کنید.
به طور کلی ، این یک ایده بسیار خوب است که قبل از رفتن به تولید ، بار کار و الگوهای بار کار را آزمایش کنید.
متن به گفتار: حد درخواست همزمان را افزایش دهید
برای ردیف قیمت گذاری استاندارد ، می توانید این مقدار را افزایش دهید. قبل از ارسال درخواست ، اطمینان حاصل کنید که با مطالب مورد بحث در این مقاله آشنا هستید ، مانند بهترین روشها برای کاهش فشار.
افزایش حد درخواست های همزمان به طور مستقیم بر هزینه های شما تأثیر نمی گذارد. سرویس گفتار از یک مدل پرداخت استفاده می کند که نیاز به پرداخت هزینه فقط برای آنچه استفاده می کنید. این حد مشخص می کند که قبل از شروع گاز درخواست های شما ، چقدر می تواند مقیاس را مقیاس کند.
شما قادر به دیدن مقدار موجود پارامتر محدودیت درخواست همزمان در پورتال لاجورد ، ابزارهای خط فرمان یا درخواست های API نیستید. برای تأیید مقدار موجود ، یک درخواست پشتیبانی لاجورد ایجاد کنید.
ظروف گفتار نیازی به افزایش حد درخواست همزمان ندارند ، زیرا ظروف فقط توسط CPU سخت افزاری که در آنها میزبان هستند محدود می شوند.
اطلاعات مورد نیاز را تهیه کنید
برای ایجاد یک درخواست افزایش ، شما منطقه استقرار خود و شناسه انتهای سفارشی را ارائه می دهید. برای به دست آوردن آن ، اقدامات زیر را انجام دهید:
- به پورتال استودیوی گفتار بروید.
- در صورت لزوم وارد سیستم شوید و به صدای سفارشی بروید.
- پروژه خود را انتخاب کنید و به استقرار بروید.
- نقطه پایانی مورد نیاز را انتخاب کنید.
- مقادیر قسمتهای زیر را کپی و ذخیره کنید:
- منطقه خدمات (منطقه پایانی شما)
- شناسه نقطه پایانی
درخواست پشتیبانی را ایجاد و ارسال کنید
با ارسال درخواست پشتیبانی ، افزایش حد درخواست های همزمان برای منابع خود را آغاز کنید ، یا در صورت لزوم حد فعلی را بررسی کنید. در اینجا چگونه: