For the rest of my analysis, I noticed that it was necessary consolidate some data to analyze.

The question :

Is it done more craters around the equatorial region (+ or – 15 °)?

What is the distribution of the diameter of the craters?

Pour la suite de mon analyse, j’ai remarqué qu’il fallait regrouper certaines données pour les analyser.

La question :

Y a t’il plus de cratères autour de la région de l’équateur (+ ou – 15°) ?

Quelle est la répartition du diamètre des cratères ?

 

My code :

import pandas
import numpy

data = pandas.read_csv('marscrater_pds.csv', low_memory=False)
print (len(data))
print (len(data.columns))


print ("counts for ID // Liste du nom des cratères")
a1 = data["ID"].value_counts(sort=False)
print (a1)

print ("counts for CRATER_NAME // Liste du nom des cratères")
c1 = data["CRATER_NAME"].value_counts(sort=False)
print (c1)

print ("counts for LATITUDE_CIRCLE_IMAGE // liste des latitudes des cratères")
l1 = data ["LATITUDE_CIRCLE_IMAGE"].value_counts(sort=False)
print (l1)

print ("percents for LATITUDE_CIRCLE_IMAGE // pourcentage des cratères en fonction de leur latitude")
pl1 = data ["LATITUDE_CIRCLE_IMAGE"].value_counts(sort=False, normalize = True)
print (pl1)

print ("counts for DIAM_CIRCLE_IMAGE // liste du diamètre des cratères")
c2 = data ["DIAM_CIRCLE_IMAGE"].value_counts(sort=False)
print (c2)

print ("percents for DIAM_CIRCLE_IMAGE // pourcentage du diamètre des cratères")
p2 = data ["DIAM_CIRCLE_IMAGE"].value_counts(sort=False, normalize = True)
print (p2)

print ("counts for DEPTH_RIMFLOOR_TOPOG // liste de l'altitude des cratères")
c3 = data ["DIAM_CIRCLE_IMAGE"].value_counts(sort=False)
print (c3)

print ("percents for DEPTH_RIMFLOOR_TOPOG // pourcentage de l'altitude")
p3 = data ["DIAM_CIRCLE_IMAGE"].value_counts(sort=False, normalize = True)
print (p3)

sub1 = data[(data['LATITUDE_CIRCLE_IMAGE']>=-15) & (data['LATITUDE_CIRCLE_IMAGE']<=15) & (data['DIAM_CIRCLE_IMAGE']>=10) ] 

sub2 = sub1.copy()

print ("list of craters around equateur with size of +10km // Liste des cratères autours de l'équateur de plus de 10km" )
c4 = sub2["ID"].value_counts(sort=False)
c5 = sub2["DIAM_CIRCLE_IMAGE"].value_counts(sort=False)
print (c4)
print("Numbers of craters and size of +10km around equateur// Nombres des cratères autours de l'équateur de plus de 10km et leur diamètre")
print (c5)

c6 = sub2["DIAM_CIRCLE_IMAGE"].value_counts(sort=False, normalize = True)
print("% of craters and size of +10km around equateur// % des cratères autours de l'équateur de plus de 10km et leur diamètre")
print (c6)

print ("Quartiles of craters around equateur and size of +10km // Quartiles des cratères de plus de 10km autours de l'équateur")
sub2['DIAM_CRAT_REPARTITION']=pandas.qcut(sub2.DIAM_CIRCLE_IMAGE, 8, labels=["1=12.5%", "2=25%", "3=37.5%", "4=50%", "5=62.5%", "6=75%", "7=87.5%", "8=100%" ])
c9 = sub2['DIAM_CRAT_REPARTITION'].value_counts(sort=False, dropna=True)
print (c9)

print('\n CRATERS DIAMETER BY GROUP')
sub2['DIAMETRE_CRATERS']=pandas.cut(sub2.DIAM_CIRCLE_IMAGE, [10,20,30,40,50,60,70,80,90,100,150,250,300,350,400,450,500])
print (pandas.crosstab(sub2['DIAMETRE_CRATERS'], sub2['DIAM_CRAT_REPARTITION']))

print ('count for diametre craters')
c10 = sub2['DIAMETRE_CRATERS'].value_counts(sort=False)
print (c10)

print ('percentages for diametre craters')
p10= sub2['DIAMETRE_CRATERS'].value_counts(sort=False, normalize=True)
print (p10)

I decided to combine all of this selection (craters around the equator of a size greater than 10km) 8 together to analyze, because the data were very varied.
Then I defined groups for the diameter of the crater to study their distribution.

This helped to give me the number of craters according to selected groups and their percentage.

We can say that we have 6240 craters larger than 10 km around the equator (ie 1.62% of the total) and 76% of them have a diameter of between 10 and 30km

J’ai décidé de regrouper l’ensemble de cette sélection (cratères autour de l’équateur d’une taille supérieur à 10km) en 8 ensemble à analyser, car les données étaient très variées.
Ensuite j’ai défini des groupes pour le diamètre des cratères pour étudier leur répartition.

Cela à permis de me donner le nombre de cratères en fonction des groupes choisis ainsi que leur pourcentage.

On peut dire que nous avons 6240 cratères de plus de 10 km autour de l’équateur  (soit 1.62% de la totalité) et que  76% d’entre eux ont un diamètre compris entre 10 et 30km

My output :

(...)


Quartiles of craters around equateur and size of +10km // Quartiles des cratères de plus de 10km autours de l'équateur
 1=12.5%    812
 2=25%      808
 3=37.5%    812
 4=50%      809
 5=62.5%    807
 6=75%      808
 7=87.5%    809
 8=100%     810
 dtype: int64

CRATERS DIAMETER BY GROUP
 DIAM_CRAT_REPARTITION  1=12.5%  2=25%  3=37.5%  4=50%  5=62.5%  6=75%  7=87.5%  8=100%
 DIAMETRE_CRATERS
 (10, 20]                   808    808      812    809      348      0       0       0
 (20, 30]                     0      0        0      0      459    808     103       0
 (30, 40]                     0      0        0      0        0      0     643       0
 (40, 50]                     0      0        0      0        0      0      63     276
 (50, 60]                     0      0        0      0        0      0       0     185
 (60, 70]                     0      0        0      0        0      0       0     129
 (70, 80]                     0      0        0      0        0      0       0      66
 (80, 90]                     0      0        0      0        0      0       0      49
 (90, 100]                    0      0        0      0        0      0       0      36
 (100, 150]                   0      0        0      0        0      0       0      43
 (150, 250]                   0      0        0      0        0      0       0      14
 (250, 300]                   0      0        0      0        0      0       0       6
 (300, 350]                   0      0        0      0        0      0       0       3
 (350, 400]                   0      0        0      0        0      0       0       0
 (400, 450]                   0      0        0      0        0      0       0       1
 (450, 500]                   0      0        0      0        0      0       0       1

count for diametre craters
 (10, 20]      3585
 (20, 30]      1370
 (30, 40]       643
 (40, 50]       339
 (50, 60]       185
 (60, 70]       129
 (70, 80]        66
 (80, 90]        49
 (90, 100]       36
 (100, 150]      43
 (150, 250]      14
 (250, 300]       6
 (300, 350]       3
 (350, 400]       0
 (400, 450]       1
 (450, 500]       1
 dtype: int64
 percentages for diametre craters
 (10, 20]      0.553668
 (20, 30]      0.211583
 (30, 40]      0.099305
 (40, 50]      0.052355
 (50, 60]      0.028571
 (60, 70]      0.019923
 (70, 80]      0.010193
 (80, 90]      0.007568
 (90, 100]     0.005560
 (100, 150]    0.006641
 (150, 250]    0.002162
 (250, 300]    0.000927
 (300, 350]    0.000463
 (350, 400]    0.000000
 (400, 450]    0.000154
 (450, 500]    0.000154
 dtype: float64
Partager !