Akar penyebab sebagai layanan secara otomatis menunjukkan apa yang sedang dimasak di log untuk resolusi cepat
togel

Akar penyebab sebagai layanan secara otomatis menunjukkan apa yang sedang dimasak di log untuk resolusi cepat

Meskipun file log adalah banyak informasi, menyisirnya adalah tugas yang menakutkan ketika perangkat lunak mengalami downtime.

Lingkungan perangkat lunak saat ini rumit karena menjalankan banyak layanan, membuat alat observabilitas menjadi penting. Meskipun ruang observabilitas menjadi pasar $ 20 miliar, biaya downtime masih melampaui $ 100 miliar, karena sebagian besar alat menyoroti kapan atau di mana kegagalan atau insiden perangkat lunak terjadi tetapi tidak mengapa hal itu terjadi, menurut Batang Baggpendiri dan wakil presiden teknik di Zebrium Inc., yang memiliki a misi menghilangkan rasa sakit dari analisis akar penyebab.

“Senang mengetahui ada sesuatu yang salah, tetapi akar penyebab mengapa hal itu terjadi akan terkubur dalam file log … untuk sampai ke sana dengan cepat, Anda lebih baik mengotomatisasi atau Anda ditakdirkan untuk gagal, dan di situlah kami masuk , ”kata Bagg.

Bagg dan Larry Lancaster (foto)pendiri dan chief technology officer Zebrium, berbicara dengan analis industri theCUBE Dave Velante selama siaran khusus dari theCUBE dan Zebrium sebagai bagian dari Acara “Root Cause as a Service: Never Dig Through Logs Again”. Mereka mendiskusikan apa akar penyebab sebagai layanan yang diperlukan dan bagaimana hal itu menghilangkan rasa sakit melalui log.

Dalam wawancara terpisah, berjudul “Bagaimana Cisco Memvalidasi RCaaS dengan Akurasi 95,8%,” Velante berbicara dengan filsuf residen Cisco Systems Inc. Atri Basu dan Necati Cehreli, pemimpin teknis tim inovasi, otomasi, dan gangguan pengalaman pelanggan. Mereka mendiskusikan bagaimana, melalui proses yang ketat dan ekstensif, Cisco menguji solusi RCaaS Zebrium menggunakan 192 insiden pelanggan aktual dan menemukan indikator akar penyebab yang benar lebih dari 95% setiap saat. (* Pengungkapan Di Bawah.)

RCaaS dengan cepat menemukan jarum di tumpukan jerami

Berurusan dengan log bukanlah urusan yang ramah, karena mendapatkan konteks yang tepat bisa memakan waktu berjam-jam. Zebrium menghilangkan kerumitan menggali log dengan menyediakan analisis akar masalah dengan cepat di dasbornya, menurut Bagg.

“Jadi, jika ada yang salah dengan metrik Anda, dan itulah indikatornya, atau mungkin ada sesuatu dengan penelusuran yang sedang Anda gali sekarang setelah Anda tahu ada yang salah, kami akan berada di dasbor yang sama,” jelasnya. “Jadi kami dikerahkan sebagai layanan SaaS. Anda mengirimkan log Anda kepada kami, mengklik salah satu integrasi kami, berintegrasi dengan semua alat ini, dan ketika kami mendeteksi apa pun yang merupakan laporan penyebab utama, itu akan muncul di dasbor Anda dalam garis waktu yang sama dengan blip di metrik Anda.”

Dalam sesinya tentang “Memperkenalkan Root Cause sebagai Layanan,” Lancaster membahas pentingnya observabilitas saat meneliti keadaan internal sistem. Namun, dia menunjukkan bahwa seseorang terbatas pada apa yang dapat mereka filter secara manual, dan itulah sebabnya mengotomatiskan pengamat menjadi pengubah permainan.

“Observabilitas adalah properti dari suatu sistem, tetapi masalahnya jika terlalu rumit, Anda hanya mendorong bottleneck ke bola mata Anda,” jelasnya. “Cara yang bagus untuk memikirkannya adalah mengotomatiskan pengamat. Ini berarti Anda mengurangi MTTR, memenuhi tujuan tingkat layanan, dan meningkatkan pengalaman pelanggan. Orang-orang telah lama mencoba mencari cara untuk mengotomatisasi bagian manusia ini dalam menemukan indikator penyebab utama, dan sampai Zebrium muncul, saya berpendapat tidak ada yang benar-benar melakukannya dengan benar.”

Karena sebagian besar perusahaan sekarang menjalankan perangkat lunak di era digital, Bagg percaya bahwa penanganan waktu henti yang cepat adalah yang membuat perbedaan. “Sangat penting bagi pelanggan kami dan sebagian besar bisnis di luar sana untuk mendorong uptime dan menghindari downtime sebanyak mungkin,” katanya.

Bagg melanjutkan ke menjelaskan kasus penggunaan khusus yang melibatkan klien AIOps yang memutuskan untuk meminta salah satu SRE-nya mendaftar ke layanan Zebrium di lingkungan SaaS-nya, mengirimkan log dari sistem klien ke Zebrium.

“Dia tidak memasukkan integrasi itu, jadi itu tidak ada di dasbornya ketika dia mengalami insiden ini, tapi itu pasti ada di kami,” kata Bagg. “Itu benar-benar akan menyelamatkannya berjam-jam. Mereka mengalami masalah ini selama lebih dari 24 jam, dan kami memiliki jawabannya dalam lima menit.”

Akar penyebab Zebrium sebagai solusi layanan berjalan baik di tempat maupun di cloud, menurut Lancaster.

“Anda dapat menjalankannya secara lokal, sama seperti kami menjalankannya di cloud kami. Anda bisa menjalankannya di cloud atau infrastruktur Anda sendiri,” jelasnya. “Anda akan menempatkan kami di dasbor Anda, dan apa pun jenis dasbornya. Itu bisa berupa Datadog, New Relic, Elastic, Dynatrace, Grafana, AppDynamics, atau ScienceLogic.”

RCaaS Zebrium telah membantu beberapa pemain besar, termasuk Seagate Lyve Cloud, menangani pemadaman dengan cepat, menurut Lancaster.

“Kami mendapat kesempatan untuk bekerja dengan Seagate Lyve Cloud … Zoom menyimpan file mereka di Lyve Cloud,” katanya. “Apa yang terjadi adalah mereka berada di alfa, dalam akses awal mereka, dan mereka mengalami pemadaman, dan itu sangat buruk karena berlangsung lebih dari sehari sebelum mereka benar-benar dipulihkan. Mereka melakukan penelitian dan melihat Zebrium. Mereka pergi ke lingkungan pementasan, menciptakan kembali insiden persis yang mereka alami, dan apa yang mereka lihat adalah Zebrium memunculkan laporan akar penyebab yang memberi tahu mereka dengan tepat akar penyebab yang mereka butuhkan selama satu hari untuk ditemukan.

Meskipun Cisco awalnya skeptis tentang solusi RCaaS Zebrium karena kedengarannya terlalu bagus untuk menjadi kenyataan, hasil yang diperoleh setelah pengujian menunjukkan bagaimana perangkat lunak yang didukung oleh pembelajaran mesin tanpa pengawasan memperhatikan detail, menurut Lancaster.

“Mereka membutuhkan waktu beberapa bulan, dan mereka melakukan studi yang sangat mendetail … mereka mengumpulkan 192 insiden di empat lini produk di mana mereka tahu bahwa akar masalahnya ada di log,” jelasnya. “Jadi mereka menjalankan data itu melalui perangkat lunak Zebrium, dan apa yang mereka temukan adalah bahwa di lebih dari 95% insiden itu, Zebrium mencerminkan indikator akar penyebab yang benar pada waktu yang tepat. Seperti itu membuat kami terpesona. ”

24.000 jam digunakan untuk sia-sia melakukan analisis log setiap hari

Memperkenalkan sesinya tentang “Bagaimana Cisco Memvalidasi RCaaS dengan Akurasi 95,8%,” Basu mengungkapkan bagaimana kira-kira 8.000 insinyur di bawah lengan dukungan Cisco, Pusat Bantuan Teknis, menghabiskan tiga jam setiap hari untuk melakukan analisis log, setara dengan 24.000 jam setiap hari. RCaaS secara signifikan membantu mengurangi sumber daya manusia yang dibutuhkan untuk menyelesaikan analisis log.

“Ketika kami memulai perjalanan ini untuk menambah alur kerja teknisi dukungan kami dengan solusi Zebrium, salah satu hal yang kami lakukan adalah kami keluar dan bertanya kepada teknisi kami seperti apa pengalaman mereka dalam melakukan analisis log,” kata Basu.

Dari 2,2 juta permintaan dukungan yang didapat Cisco TAC setiap tahun, 44% tidak penting, artinya 56% sisanya tidak sepele dan memerlukan penggalian log. Oleh karena itu, RCaaS membantu membebaskan para insinyur dengan menghilangkan banyak beban manual, menurut Basu.

“Sekitar 44% dari permintaan dukungan ini biasanya sepele dan dapat diselesaikan dalam satu panggilan atau sehari,” katanya. “Tetapi kasus TAC lainnya benar-benar melibatkan masuk ke perangkat jaringan, melihat log. Ini pekerjaan yang sangat teknis. Anda perlu berbicara dengan solusi jaringan, desainnya, protokolnya, dll.”

Karena sistem otomasi internal Cisco menghadapi tantangan seputar pemeliharaan, solusinya adalah mengotomatiskan 50% analisis log. Setelah menemukan Zebrium, RCaaS diuji di seluruh produk Cisco yang populer, yaitu klien Webex Cisco, Pusat DNA, Mesin Layanan Identitas, dan Sistem Komputasi Terpadu. Analisis log ternyata 95% benar, menurut ehreli.

“Kami membawanya, tentu saja, ke manajemen kami, dan mereka berkata, ‘Oke, mari kita coba ini dengan pengguna nyata karena log yang ada di sana adalah satu hal, tetapi insinyur yang mencapai log itu adalah hal lain,’” dia menunjukkan . “Jadi kami ingin memastikan bahwa ketika kami meletakkannya di depan pengguna dan insinyur kami, mereka benar-benar dapat membuka log itu sendiri. Dengan kumpulan sampel mendekati 200 SaaS, kami menemukan sebagian besar waktu, hampir 95% dari waktu insinyur dapat menemukan log yang mereka cari dalam analisis Zebrium.”

Tujuan lainnya mensyaratkan memiliki sistem otomasi internal tanpa pengawasan dan tanpa suara, dan Zebrium mengisi kekosongan, ehreli menambahkan.

“Kami ingin platform ini tidak diawasi … jadi tidak ada insinyur yang perlu membuat aturan, Anda tahu, memberi label log; ini buruk, ini baik,” jelasnya. “Hal terpenting lainnya bagi kami adalah kami ingin ini tidak berisik sama sekali karena apa yang terjadi dengan kebisingan, ketika tingkat kesalahan positif Anda sangat tinggi, teknisi Anda mulai mengabaikan hal-hal baik di antara kebisingan itu. Pada akhirnya, kami ingin kerangka kerja baru ini mudah beradaptasi dengan alur kerja kami yang ada, dan kami datang ke Zebrium.”

Karena log perangkat lunak dikompresi dan sulit dibaca, menganalisisnya menjadi rumit, memerlukan keahlian yang signifikan dan mata yang tajam, menurut Basu.

“Log sangat menyesal … mereka mencoba mengemas banyak informasi dalam ruang yang sangat kecil. Ini untuk alasan kinerja, alasan penyimpanan, dll, tetapi efek sampingnya adalah mereka sangat esoterik, ”jelasnya. “Jadi, mereka sulit dibaca jika Anda tidak fasih, bukan pengembang yang menulis log tersebut, atau Anda tidak mendalami kode. Jadi itu membutuhkan banyak pengetahuan tentang protokol yang diharapkan, karena ketika Anda melakukan analisis log, yang sebenarnya Anda cari adalah jarum di tumpukan jerami.”

Mengingat bahwa analisis log dulunya adalah urusan hitam dan putih, Basu yakin Zebrium mengubahnya menjadi sesuatu yang penuh warna.

“Saya pikir satu pernyataan yang benar-benar merangkum bagaimana Zebrium memengaruhi alur kerja kami adalah dari salah satu pengguna kami yang mengatakan, ‘Nah, Anda tahu, sampai Anda memberi kami alat ini, analisis log adalah urusan yang sangat hitam dan putih, tetapi sekarang menjadi benar-benar berwarna,’” katanya. “Apa yang dilakukan Zebrium adalah menyediakan banyak warna dan konteks untuk keseluruhan proses. Jadi sekarang Anda dapat dengan cepat membuka Word Cloud, menggunakan histogram interaktifnya, dan menggunakan ringkasan setiap kejadian; kamuAnda sangat cepat dapat meringkas apa mungkin terjadi dan apa yang perlu Anda perhatikan.

Nantikan video acara selengkapnya!

(* Pengungkapan: TheCUBE adalah mitra media berbayar untuk acara “Akar Penyebab sebagai Layanan”. Baik Zebrium Inc., sponsor liputan acara theCUBE, maupun sponsor lain tidak memiliki kendali editorial atas konten di theCUBE atau SiliconANGLE.)

Foto: Getty Images

Tunjukkan dukungan Anda untuk misi kami dengan bergabung dengan Cube Club dan Komunitas Pakar Acara Cube kami. Bergabunglah dengan komunitas yang mencakup Amazon Web Services dan CEO Amazon.com Andy Jassy, ​​pendiri dan CEO Dell Technologies Michael Dell, CEO Intel Pat Gelsinger dan banyak lagi tokoh dan pakar.

Untuk selagi ini bermain togel sidney dan habanero sangatlah mudah, para pemain memadai bermodal smartphone dan jaringan internet untuk dapat mencari bandar togel sidney dan toto sgp di pencarian google. Namun, wajib anda sadar tidak seluruh website togel sidney dan toto sgp yang ada di pencarian google mampu kita percayai. Karena terhadap pas ini udah terdapat ratusan web togel online penipuan yang cuma ingin capai keuntungan sepihak. Oleh dikarenakan itu kini kita menganjurkan kamu untuk bermain togel sidney dan togel singapore di web site terpercaya dan formal seperti