Kembali ke acara langsung langsung, kesan utama kami dari IBM Corp tahunan Memikirkan peristiwa beberapa minggu yang lalu adalah bahwa perusahaan menunjukkan disiplin yang tidak biasa dengan membatasi fokus pada beberapa tema inti: AI generatif dan cloud hybrid.
Mengingat hype seputar AI generatif dengan pratinjau publik ChatGPT dan peran sentralnya Pergeseran Terbuka Red Hat sebagai strategi modernisasi platform IBM, pemilihan tema tersebut tidaklah mengejutkan. Yang mengejutkan adalah bahwa IBM menempel cukup dekat dengan naskah, saat berjalan-jalan di area pameran diperkuat.
Dari sudut pandang pengumuman produk, sorotan tertuju pada yang baru watsonx keluarga penargetan produk, pembuat AI, dan profesional data. Bagi yang belum tahu, watsonx bukanlah salah ketik; mereknya sengaja dibuat dengan huruf kecil, yang mengacaukan pemeriksa ejaan. Merek tersebut, yang berbeda dari Watson yang ada, mencakup aplikasi dan perkakas berbasis AI, berfokus pada manajemen siklus hidup model AI, tata kelola model AI, dan rumah penyimpanan data baru.
Watsonx huruf kecil seharusnya mewakili generasi baru AI perusahaan. Generasi pertama sebagian besar berpusat pada pembelajaran mesin, mengembangkan model linier menggunakan algoritme seputar regresi, pengelompokan, klasifikasi, dan sebagainya. Bukan berarti pembelajaran mesin, pembelajaran mendalam, atau jaringan saraf adalah kebiasaan lama atau IBM menjauh darinya. Justru sebaliknya (dan faktanya, watsonx menyertakan sejumlah alat modal-W Watson “klasik”).
Tapi inilah pemeriksaan realitas: Percakapan anekdotal dengan peserta IBM Think menemukan sebagian besar organisasi mereka masih terjun ke pembelajaran mesin, tetapi kemungkinan menerima begitu saja yang telah disematkan dalam aplikasi yang mereka gunakan sehari-hari. Dan kami juga tidak mengabaikan penyebutan pembelajaran mendalam atau model jaringan saraf, tetapi pengembangan model kompleks semacam itu di perusahaan hingga saat ini hanya mewakili sebagian kecil dari gunung es.
Kereta model pondasi meninggalkan stasiun
IBM Research sebenarnya telah mengembangkan model dasar selama tiga hingga empat tahun terakhir, tetapi belum benar-benar meneriakkannya sampai sekarang. Tidak ada yang memiliki banyak industri lainnya, tetapi semua itu berubah dengan hype seputar ChatGPT, yang mendominasi siklus berita tahun ini. Tapi pertimbangkan ini: Enam bulan lalu, berapa banyak orang yang mendengar tentang GPT?
Generasi AI generatif baru didasarkan pada pasokan model dasar yang menghasilkan volume data yang besar dengan algoritme yang sangat kompleks; model seperti itu secara praktis tidak mungkin dikembangkan oleh perusahaan arus utama dari nol. Gagasan panduannya adalah agar organisasi memulai dengan model fondasi siap pakai dan menyesuaikannya dengan kebutuhan mereka. Kabar baiknya adalah IBM menunjukkan bahwa AI generatif tidak terbatas pada Model Bahasa Besar, atau LLMdari jenis yang terkait dengan GPT atau Bard.
IBM tidak sendirian di sini. Amazon Web Services Inc. baru-baru ini mengumumkan pratinjau pribadi dari layanan Bedrock barunya yang akan mencakup model dasar untuk LLM, teks dan percakapan, dan teks-ke-gambar yang dijalankan pada pelatihan khusus dan chip inferensi. Untuk bagiannya, Google LLC baru saja diluncurkan pilihan model pondasi untuk pengkodean, pembuatan gambar, dan percakapan selain Bard LLM yang kasar.
Awalnya, IBM menyiapkan serangkaian model yang ditargetkan secara individual untuk kasus penggunaan pembelajaran mesin generatif atau tradisional. Seperti AWS dan Google, IBM akan membahas LLM, tetapi juga menawarkan model dasar untuk geospasial, kimia molekuler (sering digunakan untuk penemuan obat), acara teknologi informasi (untuk menangani operasi TI), pembuatan kode dan dokumen (yang dapat memberikan bentuk pengetahuan pengelolaan). IBM telah mengidentifikasi “tenaga kerja digital” (misalnya, pusat kontak), otomatisasi TI, keamanan dunia maya, keberlanjutan, dan modernisasi aplikasi sebagai kasus penggunaan dengan permintaan tertinggi. Untuk model LLM, kami melihat pembuatan kode sebagai kemungkinan aplikasi pembunuh pertama.
Tantangan utama bagi pelanggan adalah menavigasi dan memilih model fondasi yang tepat, atau model, untuk tugas tersebut. IBM akan bersifat preskriptif dalam beberapa kasus, merancang model spesifik untuk kasus penggunaan tertentu. Misalnya, IBM ingin memperkaya proses seperti manajemen sumber daya manusia, pengadaan, dan keamanan siber dengan model khusus.
Karena AI generatif masih cukup baru, mempercepat perusahaan pada awalnya akan membutuhkan keterlibatan yang tinggi, mulai dari jumpstart jangka tetap hingga konsultasi tradisional. Dalam jangka panjang, kami ingin melihat AI generatif itu sendiri diterapkan dalam membantu organisasi menavigasi melalui pemilihan model dasar yang tepat, dan memberikan pengalaman terpandu untuk menyesuaikannya. Ya, ini bisa menjadi sangat meta.
Manajemen siklus hidup model
Watsonx akan mencakup pembuatan model dan lingkungan manajemen siklus hidup. Dengan demikian, ini akan menggunakan alat Watson huruf besar klasik seperti Orkestra Watson, Asisten Watson Dan Penemuan Watsondan memperkenalkan yang baru (misalnya, Asisten Kode Watson), sambil mengganti Watson Studio dengan lingkungan baru untuk pelatihan dan validasi dalam tahap pembuatan, serta penyetelan dan penyajian model untuk produksi.
Sorotan adalah penambahan meja kerja penyetelan yang dirancang khusus untuk model pondasi. Tata kelola model, yang merupakan bagian dari siklus hidup model, akan ditangani secara bersamaan watsonx.governance.
Portofolio watsonx tidak akan terbatas pada model yang dipasok oleh IBM tetapi juga akan mendukung penggunaan model yang diambil dari sumber terbuka liar seperti Wajah Pelukan. Ini akan memanfaatkan teknologi dan kerangka kerja yang memungkinkan open source seperti sinaruntuk penskalaan komputasi terdistribusi, dan PyTorchuntuk mengoptimalkan model Python untuk produksi.
Sisi tata kelola juga akan ekumenis dalam jangkauannya lintas model. IBM mengadaptasi beberapa alat Capital-W Watson untuk tata kelola AI bersama dengan kemampuan dari OpenPages, tetapi dengan ketentuan ini: Alat tata kelola ini dirancang untuk model pembelajaran mesin klasik. Untuk model dasar AI generatif, mengidentifikasi pendekatan praktis untuk tata kelola masih dalam proses.
Model membutuhkan data
Bagian lain dari teka-teki adalah watsonx.datayang merupakan basis data lakehouse baru IBM Gunung Es Apache. Kami tidak terkejut dengan pilihan IBM atas Iceberg, karena ini adalah format tabel rumah danau sumber terbuka yang telah mendapatkan dukungan lintas industri paling banyak, dan karena IBM memandang Databricks Inc., yang berada di belakang Danau Deltasebagai saingan.
Meskipun IBM hanyalah penyedia terbaru yang mendukung Iceberg, implementasinya dibedakan dengan caching terdistribusi jarak jauh, yang memungkinkan organisasi dengan data yang didistribusikan di beberapa instance fisik untuk menyimpannya di tempat yang mereka inginkan. Dan itu mendukung penyebaran cloud hybrid. Sebaliknya, sebagian besar implementasi lakehouse lainnya membatasi caching ke cluster lokal yang berdekatan dengan tempat data disimpan secara fisik.
Implementasi IBM juga mendukung interoperabilitas dengan Db2 Blu dan Kebersihan, memberikan peningkatan lift-and-shift kepada pelanggan yang sudah ada yang memungkinkan mereka memanfaatkan kemampuan lakehouse, dengan yang paling penting adalah kemampuan untuk memperluas ACID ke data yang tersimpan di penyimpanan objek cloud. Ini mencapai dua tujuan: Dengan mendukung integrasi dua arah dengan Db2 Blu (Warehouse) dan Netezza, IBM memenuhi persyaratan untuk dukungan cloud hybrid. Dengan mengintegrasikan dengan katalog data gunung es yang belum sempurna, pelanggan IBM mendapatkan akses ke format sumber terbuka populer di alam liar.
Dan, dalam implementasi IBM, mereka juga bisa menggunakan Percikan Dan Presto mesin kueri sumber terbuka. Kami berharap IBM selanjutnya akan memperbarui Watson Query (alias, Virtualisasi Data IBM) untuk mendukung mesin open source ini dan, tentu saja, terhubung ke Iceberg.
Tapi ada bagian lain di daftar keinginan kami. Kami juga ingin melihat IBM menjadikan Python warga negara kelas satu di rumah danau, sama seperti Snowflake Inc. telah melakukannya melalui nya implementasi untuk gunung es.
Memilah semuanya
Dengan merek watsonx huruf kecil baru yang bergabung dengan Watson huruf besar yang sudah ada, pasti ada kebingungan mengenai apakah watsonx adalah versi pengganti Watson yang baru. Hal yang sama berlaku untuk watsonx.data dan Cloud Pak untuk Data; apakah yang satu menggantikan yang lain?
Sebenarnya, watsonx adalah lingkungan untuk membangun, menjalankan, dan mengatur model AI. Tapi sekali lagi, ada IBM Cloud Pak untuk AIOps. Jelas, penawaran Cloud Pak yang ada diarahkan untuk mengelola siklus hidup pembelajaran mesin, daripada model dasar yang lebih ambisius. Lalu ada Cloud Pak untuk Datayang telah menjadi data utama, analitik, dan lingkungan AI IBM untuk hybrid cloud dan watsonx.data tentang lakehouse.
Mari fokus pada tata kelola. Model AI menggunakan data dan algoritme, fitur, dan hyperparameter yang menyusun model tersebut. Relevansi model dan data saling terkait erat. Anda dapat memiliki data yang benar secara teknis – yaitu, data yang melewati persyaratan kualitas, mata uang, kedaulatan/lokalisasi, dan keamanan/kontrol akses yang tepat – tetapi jika model tersebut didasarkan pada asumsi yang salah, rumah akan runtuh.
Dan kebalikannya benar jika model dibangun dengan atribut yang tepat: Jika datanya bias, atau kondisi berubah membutuhkan fitur yang berbeda, bisa dikatakan operasi masih bisa berhasil, tetapi pasien meninggal.
Jadi, IBM tidak hanya perlu menerapkan tata kelola data lengkap di watsonx.data, tetapi juga perlu mengintegrasikan fungsi tata kelola data dan model sehingga tidak ada fungsi yang disisihkan atau diimplementasikan sebagai renungan. Di bawah watsonx, tata kelola data dan model seharusnya menjadi aktivitas bersamaan. Kami percaya bahwa, minimal, aktivitas harus dikoordinasikan dan dikelola melalui satu panel kaca dan, dalam jangka panjang, memiliki kemampuan remediasi seperti kontrol bilah geser yang dapat menyulap fitur model, hyperparameter, dan pemilihan kumpulan data.
Omong-omong, IBM hampir tidak sendirian di sini. Industri data, AI, dan analitik masih perlu memikirkan hal ini.
Hal yang sama berlaku dengan merasionalisasi Cloud Pak untuk Data dengan watsonx dan arsitektur kain data cerdas IBM yang baru muncul. Sebagai rumah danau, dengan dukungan Apache Iceberg, watsonx.data akan menjadi perpanjangan logis dari Cloud Pak untuk Data. Tidak masuk akal bagi IBM untuk menawarkan dua tumpukan teknologi atau portofolio produk “data besar” yang terpisah. Dan kemampuan penemuan data, orkestrasi, dan tata kelola yang disampaikan melalui struktur data juga berperan.
Dengan watsonx sebagai awal yang baik untuk menghadirkan lingkungan build hybrid dan multicloud yang koheren untuk model AI, kami ingin melihat IBM menyelesaikan pekerjaan dengan mengintegrasikannya dengan portofolio Cloud Pak untuk Data. IBM menyatakan bahwa potongan-potongan ini cocok satu sama lain; tanggapan kami adalah bahwa mereka tidak boleh menjadi bagian yang terpisah.
Tony Baer adalah kepala sekolah di dbInsight LLC, yang memberikan pandangan independen tentang database dan ekosistem teknologi analitik. Baer adalah pakar industri dalam memperluas praktik manajemen data, tata kelola, dan analitik lanjutan untuk memenuhi keinginan perusahaan untuk menghasilkan nilai yang berarti dari transformasi berbasis data. Dia menulis artikel ini untuk SiliconANGLE.
Foto: IBM
Suara dukungan Anda penting bagi kami dan membantu kami menjaga konten tetap GRATIS.
Satu klik di bawah mendukung misi kami untuk menyediakan konten gratis, mendalam, dan relevan.
Bergabunglah dengan komunitas kami di YouTube
Bergabunglah dengan komunitas yang mencakup lebih dari 15.000 pakar #CubeAlumni, termasuk CEO Amazon.com Andy Jassy, pendiri dan CEO Dell Technologies Michael Dell, CEO Intel Pat Gelsinger, dan banyak tokoh dan pakar lainnya.
TERIMA KASIH
Untuk kala ini bermain togel sidney dan pengeluaran togel sidney sangatlah mudah, para pemain lumayan bermodal smartphone dan jaringan internet untuk dapat mencari bandar togel sidney dan toto sgp di pencarian google. Namun, harus anda sadar tidak seluruh web site togel sidney dan toto sgp yang ada di pencarian google bisa kami percayai. Karena pada selagi ini udah terkandung ratusan website togel online penipuan yang cuma idamkan raih keuntungan sepihak. Oleh gara-gara itu kini kami memberi saran kamu untuk bermain togel sidney dan togel singapore di website terpercaya dan formal seperti