Рост числа случаев диабета 2-го типа стимулирует исследования в области надежных диагностических систем. Интеграция машинного обучения улучшает эти системы, анализируя различные наборы данных и устраняя сопутствующие осложнения, такие как ожирение, вредные привычки и гипертония. Раннее обнаружение имеет решающее значение, учитывая серьезные последствия для здоровья. ОД, в сочетании с обработкой естественного языка, помогает в прогнозировании, диагностике и разработке планов профилактики. Используя набор данных PIDD (768 образцов, 16 атрибутов), данное исследование посвящено прогнозированию диабета с помощью расширенного набора характеристик. Предварительная обработка включает нормализацию, балансировку с помощью SMOTE и проверку полноты для повышения точности модели. В целом, данное исследование подчеркивает ключевую роль ML в улучшении понимания и прогнозирования диабета 2 типа с помощью тщательной методологии и выбора наборов данных.