عندما نقوم بتكييف خوارزمية التعلم الآلي مع مجموعة بيانات، فإننا عادةً ما نقسم مجموعة البيانات إلى ثلاثة أجزاء: 1. مجموعة التدريب : تستخدم لتدريب النموذج. 2. مجموعة التحقق من الصحة : تستخدم لتحسين معلمات النموذج. 3. مجموعة الاختبار : تستخدم للحصول...
يمكنك استخدام بناء الجملة التالي لإجراء مرشح “ليس في” في DataFrame الباندا: df[ ~ df[' col_name ']. isin (values_list)] لاحظ أن القيم الموجودة في Values_list يمكن أن تكون قيمًا رقمية أو قيمًا أحرفًا. توضح الأمثلة التالية كيفية استخدام بناء الجملة هذا...
يمكنك استخدام إحدى الطريقتين لإنشاء مصفوفة بسرعة من المتجهات في R: الطريقة الأولى: استخدم cbind() لربط المتجهات في المصفوفة بواسطة الأعمدة my_matrix <- cbind(vector1, vector2, vector3) الطريقة الثانية: استخدم rbind() لربط المتجهات في المصفوفة حسب الصفوف my_matrix <- rbind(vector1, vector2, vector3)...
هناك طريقتان يمكنك استخدامهما لتحويل قيم التاريخ إلى قيم رقمية في R: الطريقة الأولى: استخدام as.numeric() as. numeric (my_date) سيعيد هذا عدد الثواني التي مرت بين كائن التاريخ الخاص بك و1/1/1970. الطريقة الثانية: استخدام وظائف حزمة التشحيم library (lubridate) #get seconds...
يمكنك استخدام الطرق التالية للعثور على القيم المفقودة في R وحسابها: الطريقة الأولى: البحث عن موقع القيم المفقودة which( is.na (df$column_name)) الطريقة الثانية: حساب إجمالي القيم المفقودة sum( is.na (df$column_name)) توضح الأمثلة التالية كيفية استخدام هذه الوظائف عمليًا. مثال 1: البحث...
هناك طريقتان أساسيتان لحساب إحصائيات ملخص المجموعة في R: الطريقة الأولى: استخدم Tapply() من Base R tapply(df$value_col, df$group_col, summary) الطريقة الثانية: استخدم group_by() من حزمة dplyr library (dplyr) df %>% group_by (group_col) %>% summarize (min = min(value_col), q1 = quantile(value_col, 0.25...
يمكنك استخدام إحدى الطريقتين لتقسيم عمود إلى أعمدة متعددة في R: الطريقة الأولى: استخدام str_split_fixed() library (stringr) df[c(' col1 ', ' col2 ')] <- str_split_fixed(df$original_column, ' sep ', 2) الطريقة الثانية: استخدام منفصل () library (dplyr) library (tidyr) df %>% separate(original_column,...
يمكنك استخدام أي من الطرق التالية لحساب عدد القيم المميزة في إطار بيانات R باستخدام وظيفة dplyr ‘s n_distinct() : الطريقة الأولى: حساب القيم المميزة في عمود n_distinct(df$column_name) الطريقة الثانية: حساب القيم المميزة في كافة الأعمدة sapply(df, function (x) n_distinct(x)) الطريقة...
يمكنك استخدام الدالتين =UNIQUE() و =COUNTIF() لحساب عدد تكرارات القيم المختلفة في عمود جداول بيانات Google. يوضح المثال التالي خطوة بخطوة كيفية القيام بذلك. الخطوة 1: أدخل البيانات لنبدأ بإدخال أسماء بعض فرق كرة السلة المحترفة في العمود أ: الخطوة 2:...
يمكنك استخدام بناء الجملة الأساسي التالي لاستخدام مرجع الخلية في استعلام جداول بيانات Google: = QUERY ( $A$1:$B$11 , "Select B where A contains '" & D3 & "'" ) في هذا الاستعلام تحديدًا، نطلب من جداول بيانات Google تحديد القيمة...