Vucos Logo

Gözlemlenebilirlik & İzleme

İzler, metrikler ve log'lar — ilişkilendirilmiş, sorgulanabilir ve size ait. Sabah 3'teki bir olayı beş farklı sağlayıcı konsolu arasında kriz odası avına dönüştürmek yerine 9 dakikalık bir teşhis süresine indiren gözlemlenebilirlik omurgası.

9 dk
NOC modernizasyonu sonrası ortalama teşhis süresi
1 dk
Canlı dashboard'lar için metrik çözünürlüğü
2 yıl
Tam çözünürlükte metrik saklama
%73
Tekrarlı nöbet sayfalamalarındaki azalma

Tek Sinyal Düzlemi, Her Katman

Vucos Observability, OpenTelemetry üzerine kurulmuş birleşik bir telemetri düzlemidir. Her servis; aynı trace ID'lerini, kiracı ID'lerini ve oturum ID'lerini paylaşan dağıtık izler, metrikler ve yapılandırılmış log'lar yayar — böylece bir izleyici oynatma hatası, bir DRM lisans reddi ve bir faturalama webhook yeniden denemesi tek bir sorguda birleşir. SLO'lar, uyarı kuralları ve NOC'a hazır dashboard'lar varsayılan olarak gelir ve tamamen özelleştirilebilir; telemetri aynı zamanda Grafana, Datadog ve Splunk gibi operatörün sahip olduğu yığınlara da akar.

Neden önemli

OTT'yi ölçekte yürütmek bir dağıtık sistemler problemidir. Tek bir izleyici şikayeti bir düzine servise dokunabilir — kimlik doğrulama, yetkilendirme, DRM, origin, CDN, player telemetrisi, faturalama, CDN log'ları — her biri kendi gecikme, hata ve yeniden deneme davranışıyla. Birleşik bir gözlemlenebilirlik katmanı olmadan nöbetçi mühendisler bir olayın büyük bölümünü sorunu çözmek yerine araçlar arasında zaman damgalarını ilişkilendirmekle geçirir. MTTR uzar, aynı olaylar tekrar eder ve NOC her sıçramayı yeniymiş gibi ele alır.

Vucos gözlemlenebilirliği bir ürün ilkel'i olarak sunar, sonradan eklenen bir parça olarak değil. Trace ID'leri; ingest, kodlama, edge, API ve istemci boyunca uçtan uca yayılır. Her metrik aynı depoda dakika seviyesinde çözünürlükle ve önemli olduğu yerde çok yıllık saklamayla yaşar. Uyarı kuralları, OTT platformlarının gerçekten karşılaştığı arıza modları için önceden bağlı gelir — jenerik CPU ve bellek uyarıları değil.

Platformun açığa çıkardıkları

Dağıtık izleme

Player SDK'den edge, API, backend servisler ve harici sağlayıcılara kadar bir isteği takip eden OpenTelemetry yerel izleri. W3C trace context, örneklemeli ve head-based izleme, tam span öznitelikleri.

Yüksek kardinaliteli metrikler

1 dakika çözünürlük ve yapılandırılabilir saklamayla Prometheus uyumlu metrikler. Yüksek kardinaliteli etiketler (kiracı, cihaz, içerik kimliği, CDN) ön toplamasız sorgulanabilir kalır.

Yapılandırılmış log'lar

İz ilişkilendirmesi, kiracı kapsamlandırması ve PII farkındalığına sahip alan maskelemeli JSON yapılandırılmış log'lar. Konsol üzerinden aranabilir veya SIEM'inize akıtılabilir.

SLO'lar & hata bütçeleri

Oynatma başlangıcı, rebuffer oranı, API erişilebilirliği ve DRM lisans gecikmesi için Hizmet Seviyesi Hedefleri — burn-rate uyarıları, kalan hata bütçesi ve haftalık inceleme raporlarıyla.

Uyarı & nöbet

PagerDuty, Opsgenie, Slack ve Microsoft Teams ile yerel entegrasyonlar. Çoklu sinyal uyarıları sayfalama gürültüsünü azaltır; her uyarı, tetikleyen izlere ve log'lara geri bağlanır.

NOC'a hazır dashboard'lar

Canlı etkinlik kriz odaları, bölgesel sağlık, CDN portföy performansı, DRM başarı oranları ve abone etkisi için önceden hazırlanmış dashboard'lar — NOC ekranlarınız için markalanmış.

Operatörler nasıl kullanıyor

Pay-TV operatörü

NOC modernizasyonu

Sağlayıcıya özel dashboard duvarı (kodlayıcı, CDN, DRM, faturalama) tek bir operasyon görünümüyle değiştirildi. İz bağlantılı uyarılar, ortalama teşhis süresini 42 dakikadan 9 dakikaya indirdi ve tekrarlı sayfalamayı %73 azalttı.

Spor yayıncısı

Canlı etkinlik kriz odası

Büyük maçlar sırasında adanmış bir kriz odası dashboard'u; eşzamanlı izleyiciler, bölge başına QoE yüzdelikleri, CDN bölüşümü ve risk altındaki geliri gösterir — şikayetler sosyal medyaya ulaşmadan önce tetiklenen burn-rate uyarılarıyla.

SVOD hizmeti

Olay sonrası analiz izlenebilirliği

Her üretim olayı 90 gün boyunca izlerini korur; etkilenen izleyici oturumları, yukarı akış nedeni (örneğin DRM sağlayıcı gecikmesi) ve gelir etkisi dahil — böylece post-mortem'lar spekülasyon yerine mühendislik belgelerine dönüşür.

Teknik detaylar

Telemetri standartları
  • OpenTelemetry izler, metrikler, log'lar
  • W3C Trace Context yayılımı
  • Prometheus exposition
  • OTLP ve HTTP export
Saklama
  • Metrikler: 1 dakika çözünürlükte 2 yıl
  • İzler: 7-30 gün (yapılandırılabilir)
  • Log'lar: 90 gün sıcak, çok yıl soğuk
  • SLO raporları: süresiz
Uyarı entegrasyonları
  • PagerDuty
  • Opsgenie
  • Slack
  • Microsoft Teams
  • Webhook'lar
  • E-posta
Export hedefleri
  • Grafana
  • Datadog
  • Splunk
  • New Relic
  • Honeycomb
  • Elastic / OpenSearch
SLO kapsamı
  • Oynatma başlangıcı (p95)
  • Rebuffer oranı
  • API erişilebilirliği
  • DRM lisans gecikmesi
  • Manifest teslimi
  • Ingest sağlığı
Erişim & güvenlik
  • SAML ve OIDC üzerinden SSO
  • Kapsamlı RBAC
  • Sorgu ve uyarı değişikliklerinin denetim kaydı
  • PII alan maskeleme

Key Takeaways

  • Uçtan uca trace ID'leriyle OpenTelemetry yerel izler, metrikler ve log'lar
  • Kiracı, cihaz, içerik ve CDN'ye göre sorgulanabilen yüksek kardinaliteli metrikler
  • Oynatma başlangıcı, rebuffer, API ve DRM lisans gecikmesi için SLO'lar
  • Canlı etkinlikler, bölgesel sağlık ve CDN portföyü için NOC'a hazır dashboard'lar
  • PagerDuty, Opsgenie, Slack ve Teams'e yerel uyarı yönlendirme
  • Grafana, Datadog, Splunk, Honeycomb ve kendi yığınınıza export

Sıkça Sorulan Sorular

Vucos dashboard'larını kullanmak zorunda mıyız yoksa kendi yığınımızı saklayabilir miyiz?
İkisi de mümkün. Vucos, ilk günden itibaren isteyen operasyon ekibi için birinci sınıf dashboard'lar sunar, ancak her sinyal — izler, metrikler, log'lar — standart OpenTelemetry ve Prometheus uç noktaları aracılığıyla Grafana, Datadog, Splunk veya bugün çalıştırdığınız herhangi bir araca akar. Birçok operatör OTT'ye özgü görünümler için Vucos dashboard'larını ve diğer her şey için mevcut araçlarını kullanır.
Sağlayıcılar arası iz ilişkilendirmesi gerçekte nasıl çalışıyor?
İz bağlamı, W3C standartları kullanılarak her Vucos servisi boyunca ve bunu destekleyen üçüncü taraf sağlayıcılara yayılır (çoğu CDN, DRM sağlayıcısı ve reklam sunucusu artık destekliyor). Bir sağlayıcı desteklemediğinde Vucos, giden isteği ve yanıtı ilişkilendirici ID'lerle yakalar ve iz grafiğine geri bağlar — böylece bir sağlayıcı kara kutusu bile görünür bir span bırakır.
SLO'lar sabit mi, yoksa kendi tanımlarımızı yapabilir miyiz?
Her OTT hizmetinde önemli olan metrikler için sabit varsayılanlar gelir (başlangıç, rebuffer, API erişilebilirliği, DRM lisansı, ingest). Bunun ötesinde kendinizinkileri tanımlayın: herhangi bir metriği seçin, hedefi, pencereyi ve burn-rate uyarılarını belirleyin. SLO'lar değişiklik geçmişi ve haftalık otomatik raporları olan birinci sınıf nesnelerdir.
Log'lar ve izlerdeki PII duruşu nedir?
PII içeren alanlar şema düzeyinde işaretlenir ve kiracı politikasına göre maskelenir, hash'lenir veya düşürülür. İz öznitelikleri aynı şekilde ele alınır. Sorgu erişimi RBAC ile kapsamlandırılır ve her sorgu denetlenir — özellikle düzenlenmiş pazarlarda veya GDPR/DPA taahhütleri altındaki operatörler için önemlidir.
Tek bir metrik değil, çoklu sinyal koşullarında sayfalayabilir miyiz?
Evet. Uyarı kuralları metrikler, izler ve log desenleri arasında birleşir. Klasik bir örnek: yalnızca rebuffer oranı %1'i aştığında, eşzamanlı izleyiciler 100 bin üzerindeyken ve player SDK hata akışı CDN'e özgü kodlar gösterdiğinde sayfala — böylece sayfa, gece yarısı istatistiksel bir dalgalanma değil gerçek bir olay üzerine tetiklenir.
Bunun Vucos Analytics'ten farkı nedir?
Analytics; iş ve ürün sinyalleri içindir (ARPU, churn, içerik ROI'si, QoE eğilimleri) — analistler ve liderlik için tasarlandı. Observability ise mühendislik sinyalleri içindir (izler, çalışma zamanı metrikleri, hata bütçeleri) — nöbet ve NOC için tasarlandı. Altta yatan telemetriyi paylaşırlar ancak farklı izleyici kitleleri ve saklama ufukları için optimize edilmiştir.

İlgili

Daha fazlasını öğrenmeye hazır mısınız?

Bunun dağıtımınıza nasıl uyduğunu bir mimarla görüşün.