Pandas ???????????? ??????? AI ?????? Machine Learning Beginners ?????? ????????? Easy Guide
Pandas ?????? ??????????????????????????? ?????? ?????????-??????????????? Python ??????????????????????????? ??????, ?????? Artificial Intelligence (AI) ?????? Machine Learning (ML) ????????? ???????????? ?????????????????????????????? ?????? ???????????????????????? ?????? ????????? ?????????????????? ????????? ?????? ??????????????? ?????? ???????????? ????????? Pandas ???????????? ?????? ?????????????????? ??????????????? (???????????? ????????????????????????????????????) ????????? ??????????????? ???????????? ?????? ????????? DataFrames ?????? Series ???????????? ???????????? ????????????????????????????????? ?????????????????? ???????????? ??????, ?????? ???????????? ?????????????????????????????????????????? ?????? ???????????? ????????????????????????????????? ?????? ????????? ?????????????????? ???????????? ?????? ??????????????? ?????????, ?????? Pandas ?????? ??????????????? ?????? ?????????????????????????????? ????????????????????????????????? ?????? ??????????????? ??????????????????????????? ??????????????????, ???????????? DataFrames, Series, ???????????? ????????????????????????, ?????? ???????????? ???????????????????????????
?????? ??????????????? ?????? ???????????????????????? ???????????????????????? ?????? ?????????????????????????????? ????????????????????? ?????? ??????????????? ?????? ?????????????????? ????????????????????????????????? ?????????????????? ??????, ?????? AI/ML ????????????????????????????????? ?????? ???????????? ???????????? ???????????? ?????? ?????? ??????????????????????????? ?????? ????????? ????????????????????????????????????, AI/ML ????????? ???????????? ???????????? ?????????, ?????? ?????????????????????????????? ??????????????? ?????? ????????? ????????? ?????????????????????
??????????????? ???????????? ??????? - What is Pandas in Hindi?
Pandas ?????? Python ??????????????????????????? ??????, ?????? ???????????? ?????????????????????????????? ?????? ???????????????????????? ?????? ????????? ????????????????????? ?????? ?????? ????????? ???????????? ???????????? ????????? "Python Data Analysis Library" ??????, ?????? ????????? 2008 ????????? Wes McKinney ?????? ??????????????? ???????????? ????????? ??????????????? ?????? ?????????????????? ?????? ?????? ?????? ?????? ???????????? ?????? ??????????????? ?????? ?????????, ?????????????????????, ?????? ???????????????????????? ???????????? ?????? ?????????????????? ???????????? ??????, ?????? AI ?????? ML ????????? ???????????? ?????????????????????????????????????????? ?????? ????????? ?????????????????? ?????????
Pandas ?????? ?????????????????? ??????????????????:
- DataFrames ?????? Series: ?????????????????? ?????? 1D ???????????? ????????????????????????????????? ?????? ???????????? ?????????????????????????????? ?????? ???????????? ??????????????? ????????????
- ???????????? ????????????????????????: ?????????????????? ????????????????????????, ?????????????????????????????????, ?????? ??????????????????????????? ?????? ??????????????? ???????????????
- ???????????? ??????????????????????????????????????????: ???????????? ?????? ?????????????????????, ???????????????, ?????? ???????????? ???????????? ?????? ?????????????????????
- ??????????????????????????????: NumPy, Matplotlib, ?????? Scikit-learn ?????? ????????? ???????????? ?????????????????????????????????
AI/ML ????????? ???????????? ?????????: Pandas ?????? ??????????????? ???????????? ?????????????????????????????????????????? (???????????? ?????????????????? ???????????????????????? ??????????????? ????????????), ???????????? ?????????????????????????????????, ?????? ???????????? ???????????????????????? (???????????? ???????????????????????????????????? ?????????????????????????????????) ?????? ????????? ???????????? ?????????
??????????????? ??????????????? - Pandas Setup in Hindi
??????????????? ?????? ????????? AI/ML ???????????? ???????????? ?????? ????????? ???????????? ???????????? ????????? ????????????????????? ???????????? ?????????????????? ?????????
1. Pandas ?????????????????????????????? - Installation
-
???????????????: ????????????????????? ?????? ??????????????? ??????????????????????????? ????????? ?????????????????????????????? ??????????????? ?????? ????????????:
pip install pandas
-
??????????????????????????????: Python ????????? ??????????????? ????????????????????? ???????????? ????????? ????????????:
import pandas as pd
print("Pandas Version:", pd.__version__)
??????????????????:
Pandas Version: 2.0.3
2. ????????????????????????????????? ??????????????? - Environment Setup
- Jupyter Notebook: Pandas ?????? ????????? ???????????? ???????????????????????? ?????? ?????????????????????????????????????????? ?????? ????????? ??????????????????
- Anaconda: Pandas ????????????-??????????????????????????? ????????? ?????????
- VS Code: Pandas ????????? ??????????????? ?????? ??????????????? ???????????? ?????? ????????? ????????????????????????
AI/ML ????????? ????????????: Pandas ?????? ???????????? ???????????? ?????????????????????????????????????????? ?????? ML ?????????????????? ?????? ????????? ??????????????????????????? ??????????????? ???????????? ????????? ???????????? ?????????
??????????????? ?????? ??????????????? ????????????????????????????????? - Basic Concepts of Pandas in Hindi
1. Series ?????? DataFrames
??????????????? ????????? ?????? ??????????????? ???????????? ????????????????????????????????? ?????????: Series (1D ????????????) ?????? DataFrame (2D ?????????????????? ????????????)???
????????? ??????????????????????????????: Series ?????? DataFrame ??????????????????
import pandas as pd
# Creating a series
features = pd.Series([1.5, 2.3, 3.1, 4.7])
print("Series:\n", features)
# Create a DataFrame
data = {'Feature1': [1, 2, 3], 'Feature2': [4.5, 5.5, 6.5]}
df = pd.DataFrame(data)
print("\nDataFrame:\n", df)
??????????????????:
Series:
0 1.5
1 2.3
2 3.1
3 4.7
dtype: float64
DataFrame:
Feature1 Feature2
0 1 4.5
1 2 5.5
2 3 6.5
AI/ML ????????? ????????????: Series ?????? ???????????? ??????????????? ???????????? ???????????? (???????????? ??????????????????) ?????? DataFrame ?????? ???????????? ??????????????????????????? (???????????? ?????????????????? ?????? ??????????????????) ?????? ??????????????? ???????????? ?????? ????????? ???????????? ?????????
2. ???????????? ???????????????????????? - Data Cleaning
??????????????? ???????????? ???????????????????????? ?????? ????????? ?????? ??????????????? ?????????????????? ???????????? ??????, ???????????? ?????????????????? ???????????????????????? ?????? ??????????????? ???????????? ?????? ????????????????????????????????? ??????????????????
????????? ??????????????????????????????: ?????????????????? ???????????????????????? ?????? ??????????????? ???????????????
import pandas as pd
# Missing values in the DataFrame
data = {'Feature1': [1, None, 3], 'Feature2': [4.5, 5.5, None]}
df = pd.DataFrame(data)
print("Original DataFrame:\n", df)
# Filling missing values with the mean
df['Feature1'].fillna(df['Feature1'].mean(), inplace=True)
df['Feature2'].fillna(df['Feature2'].mean(), inplace=True)
print("\nCleaned DataFrame:\n", df)
??????????????????:
Original DataFrame:
Feature1 Feature2
0 1.0 4.5
1 NaN 5.5
2 3.0 NaN
Cleaned DataFrame:
Feature1 Feature2
0 1.0 4.5
1 2.0 5.5
2 3.0 5.0
AI/ML ????????? ????????????: ???????????? ???????????????????????? ?????? ???????????? ML ?????????????????? ?????? ???????????? ?????? ????????????????????? ???????????? ?????????????????? ???????????? ?????? ????????? ???????????? ?????????
3. ???????????? ?????????????????????????????? - Data Manipulation
??????????????? ???????????? ?????? ?????????????????????, ???????????????, ?????? ???????????? ???????????? ?????? ????????? ??????????????? ?????????????????? ???????????? ?????????
????????? ??????????????????????????????: ???????????? ?????????????????????????????? ?????? ???????????????????????????
# Create a DataFrame
data = {'Name': ['Model1', 'Model2', 'Model3'], 'Accuracy': [85, 90, 88]}
df = pd.DataFrame(data)
# Filtering
high_accuracy = df[df['Accuracy'] > 85]
print("High Accuracy Models:\n", high_accuracy)
# Grouping
mean_accuracy = df['Accuracy'].mean()
print("\nMean Accuracy:", mean_accuracy)
??????????????????:
High Accuracy Models:
Name Accuracy
1 Model2 90
2 Model3 88
Mean Accuracy: 87.66666666666667
AI/ML ????????? ????????????: ???????????? ?????????????????????????????? ?????? ???????????? ???????????? ???????????????????????? ?????? ???????????? ???????????????????????? ????????? ???????????? ?????????
4. ???????????? ????????????????????? - Data Merging
??????????????? ?????????-????????? ??????????????????????????? ?????? ???????????? ???????????? ?????? ????????? ??????????????? ???????????? ??????, ?????? ML ????????? ????????????????????? ??????????????? ?????? ???????????? ??????????????????????????? ???????????? ?????? ????????? ?????????????????? ?????????
????????? ??????????????????????????????: DataFrames ???????????? ???????????????
# Two DataFrames
df1 = pd.DataFrame({'ID': [1, 2, 3], 'Feature1': [10, 20, 30]})
df2 = pd.DataFrame({'ID': [1, 2, 4], 'Feature2': [4.5, 5.5, 6.5]})
# Merge
merged_df = pd.merge(df1, df2, on='ID', how='inner')
print("Merged DataFrame:\n", merged_df)
??????????????????:
Merged DataFrame:
ID Feature1 Feature2
0 1 10 4.5
1 2 20 5.5
AI/ML ????????? ????????????: ????????????????????? ?????? ???????????? ????????????????????? ??????????????????????????? (???????????? ???????????????????????? ?????? ??????????????? ????????????) ?????? ?????????????????? ???????????? ?????? ????????? ???????????? ?????????
AI ?????? ML ????????? ??????????????? ?????? ??????????????? - Advantages of Pandas in AI & ML in Hindi
- ???????????????-????????????????????????: ??????????????? ?????? ????????????????????? ????????? ?????? ?????????????????????????????? ???????????? ?????????
- ???????????? ????????????????????????: ?????????????????? ???????????????????????? ?????? ????????????????????????????????? ?????? ??????????????? ?????? ??????????????? ???????????? ?????????
- ??????????????????????????????????????????: ???????????? ?????? ?????????????????????, ???????????????, ?????? ????????????????????????????????? ???????????? ?????? ????????? ?????? ??????????????????
- ??????????????????????????????: NumPy ?????? Matplotlib ?????? ????????? ??????????????? ?????? ????????? ???????????? ??????
AI ?????? ML ????????? ??????????????? ?????? ???????????? ????????? - Use Cases of Pandas in AI & ML in Hindi
- ???????????? ??????????????????????????????????????????: ?????????????????? ????????????????????????, ???????????????????????????, ?????? ????????????????????????????????? ?????? ??????????????? ???????????????
- ???????????? ?????????????????????????????????: ???????????? ?????? ?????? ?????????????????? ???????????????, ???????????? ??????????????????????????????????????????
- ???????????? ????????????????????????: ???????????? ?????? ???????????????????????????????????? ????????????????????????????????? (???????????? ?????????, ??????????????????) ????????????????????????
- ???????????? ??????????????????????????????????????????: Matplotlib ?????? ????????? ???????????? ???????????????????????????
???????????? ??????????????????????????? ??????????????????: ?????? ????????????????????? ?????? ??????????????? ???????????????????????? ???????????? ?????? ??????????????????????????? ???????????????, ?????? ????????? ?????? ???????????????????????? ???????????????????????? ?????????????????????
# Mini Project: Dataset Analysis
import pandas as pd
# Dataset
data = {'Model': ['Model1', 'Model2', 'Model3'], 'Accuracy': [85, 90, 88]}
df = pd.DataFrame(data)
# Basic Analysis
mean_accuracy = df['Accuracy'].mean()
max_accuracy = df['Accuracy'].max()
print("Mean Accuracy:", mean_accuracy)
print("Max Accuracy:", max_accuracy)
??????????????????:
Mean Accuracy: 87.66666666666667
Max Accuracy: 90
??????????????? ????????? ??????????????? ????????????????????????????????? - Best Practices in Pandas in Hindi
- ??????????????? ?????????: ??????????????????????????????????????? ???????????? ??????????????? ?????? ????????????????????? ???????????? ???????????????
- ?????????????????? ???????????????????????????: ???????????? ??????????????????????????? ?????? ????????? ???????????? ?????????????????? ?????????????????????????????? ???????????? (???????????? float32).
- ???????????????????????????????????????: ????????? ????????? ????????????????????? ?????? ??????????????????????????????????????? ??????????????? ?????????????????????
- ???????????????????????????: Kaggle ??????????????????????????? ?????? ??????????????? ????????????????????????????????? ???????????????
???????????????????????? - Conclusion
Pandas ?????? ??????????????????????????? ??????????????????????????? ?????? ?????? AI ?????? ML ????????? ???????????? ?????????????????????????????? ?????? ???????????????????????? ?????? ???????????? ??????????????? ????????? ?????? ??????????????? ????????? ???????????? ??????????????? ?????? ??????????????? ????????????????????????????????? ???????????? Series, DataFrames, ???????????? ????????????????????????, ?????? ???????????? ????????????????????? ?????? ??????????????? ??????????????????????????? ????????????, ????????? ?????? AI/ML ????????? ???????????? ???????????? ????????? ?????? ?????? ????????? ???????????????
???????????? ????????????????????? ????????? ?????? Matplotlib, Scikit-learn, ?????? ???????????? AI/ML ?????????????????????????????? ?????? ??????????????? ??????????????????????????? ??????????????????, ?????? ?????????????????????????????? ????????????????????????????????? ?????? ??????????????????????????? ??????????????????????????? ???????????? ???????????? ?????? ???????????? AI/ML ????????????????????????????????? ????????? ??????????????? ?????? ??????????????? ????????????!
Also Read:??