Diversité spécifique

Author

Ludivine Codoner

Published

2026-03-17

Packages

Code

source("03.script/00_packages.R")

Structuration des données

Importation - DATA

Les données proviennent d’un tableau Excel (.xlsx).

Package utilisé
- readxl

OUTPUT
- DATA [402 x 3824]: dataframe contenant l’ensemble des données floristiques et des métadonnées.

METADATA et FLORE

Les données brutes sont coupées pour ne garder que les relevés de 2021 (DATA_21), correspondant aux derniers relevés en date. A cette date, les relevés ont également été effectué en Charente-Maritime, ceux-ci ont aussi été enlevés.

Packages utilisés
- dplyr
- stringr

Code

source("03.script/02_cleaning.R")

OUTPUT
- DATA_21 [401 x 454] : dataframe contenant les métadonnées et les relevés floristiques de 2021 et uniquement de la Gironde et des Landes.
- METADATA [453 x 64] : contient les variables environnementales et logistiques.
- FLORE [453 x 343] : contient les valeurs de coefficient de Braun-Blanquet pour chaque relevé et chaque espèce.

Code

source("03.script/03_functions.R")

Analyses descriptives

Informations descriptives du jeu de données. Nombre d’espèces recensées en 2021 et leur occurence dans les relevés et les transects.

Package utilisé
- dplyr

Code

species_cols <- !colnames(FLORE) %in% c("transect_numb", "REL") # Pour ne convertir que les esp

# Richesse spécifique 2021
richesse_all <- sum(colSums(FLORE[, species_cols] != "", na.rm = TRUE) > 0) # 109

# Liste des espèces recensées (présentes au moins une fois)
esp_recensees <- colnames(FLORE[, species_cols])[
  colSums(FLORE[, species_cols] != "", na.rm = TRUE) > 0
]

# Analyses exploratoires espèce-centrée
Recensement <- tibble(
  Espèce = esp_recensees,
  Nb_relevés = colSums(FLORE[, esp_recensees] != "", na.rm = TRUE)
) %>% # espèces + nombre de relevés où elles sont présentes
  mutate(
    Nb_Transects = sapply(esp_recensees, function(sp) {
      length(unique(FLORE$transect_numb[FLORE[[sp]] != ""]))
    }) -
      1
  ) %>% # nombre de transects où chaque espèce est présente
  arrange(desc(Nb_relevés)) # les espèces les plus fréquentes au début

Télécharger ce tableau

OUTPUT
- richesse_all : richesse spécifique sur l’ensemble des données 2021.
- esp_recensees : liste des espèces présentes au moins une fois dans les données.
- Recensement : pour chaque espèce, nombre de relevés et le nombre de transects dans lesquelles elle apparaît.

Analyses exploratoires (par relevés)

Faciès

Code

facies <- METADATA %>%
  filter(!is.na(Type_habitat)) %>%
  count(Type_habitat, sort = TRUE)

Code

chisq.test(facies$n)


    Chi-squared test for given probabilities

data:  facies$n
X-squared = 1137.8, df = 16, p-value < 2.2e-16

Télécharger ce tableau

Braun-Blanquet -> % recouvrement

Le coefficient de Braun-Blanquet est composé de classes de présence correspondant à des fréquences relatives (%). Pour analyser ces données, les valeurs d’abondance-dominance selon Braun-Blanquet (1932) ont été remplacées par le recouvrement moyen (%), comme présenté par Dufrêne (1998 in Meddour 2011) via la fonction bb_to_cover.

Package utilisé
- dplyr

Code

#### FLORE_cover ----
FLORE_cover <- apply(FLORE[, species_cols], 2, bb_to_cover) # applique la fonction à toutes les colonnes espèces de FLORE -> matrice % recouvrement
FLORE_cover <- as.data.frame(FLORE_cover) # matrce -> dataframe
FLORE_cover[is.na(FLORE_cover)] <- 0 # Remplace les NA par 0 pour calculer Shannon
FLORE_cover$REL <- FLORE$REL # ajoute colone REL depuis FLORE
FLORE_cover$transect_numb <- FLORE$transect_numb # ajoute colonne transect depuis FLORE
FLORE_cover <- FLORE_cover %>%
  select(REL, transect_numb, everything()) # Met le numéro du relevé et du transect en premières colonnes

##### REL_to_transect ----
# REL_to_transect permet de garder un tableau de conversion
REL_to_transect <- FLORE %>%
  select(REL, transect_numb) %>%
  distinct() # table de jointure

OUTPUT
- bb_to_cover : fonction qui convertit le coefficient de Braun-Blanquet (Braun-Blanquet, 1932) en % de recouvrement moyen (Dufrêne 1998 in Meddour 2011).
- species_cols : vecteur logique pour séparer les colonnes d’esp avec les autres colonnes. Permet de sélectionner uniquement les colonnes d’espèces.
- FLORE_cover [453 x 343] : dataframe avec le recouvrement moyen (%) des espèces en fontion des relevés.
- REL_to_transect [453 x 2] : dataframe permettat la mise en relation des relevés avec le transect correspondant.

Télécharger ce tableau

Dendrogramme (REL)

Utilisation de dataframe FLORE_cover_esp transformé en log -réduit l’effet des dominants- afin d’obtenir une matrice de distance avec la méthode de Bray-Curtis (Bray & Curtis, 1957). La méthode Bray-Curtis est utilisée pour mesurer les différences en abondances entre relevés. La métrique de distance Bray-Crutis est non-métrique, c’est pourquoi elle ne peut pas être utilisé avec l’algorithme de regroupe de Ward qui nécessite une distance métrique. Pour cela, les résultats Bray-Curtis sont transformés en racine carrée. Les clusters sont créés via la méthode de Ward.D2 qui maximise la variance intra-groupe.

Packages utilisés
- vegdist
- dendextend

Code

#### Préparation data ----
FLORE_cover_esp <- FLORE_cover[, species_cols]
FLORE_cover_esp <- FLORE_cover_esp[rowSums(FLORE_cover_esp, na.rm = TRUE) > 0, ]
FLORE_cover_esp <- FLORE_cover_esp[, colSums(FLORE_cover_esp, na.rm = TRUE) > 0]
FLORE_cover_esp_log <- log1p(FLORE_cover[, species_cols]) # Réduction des effets des dominants
rownames(FLORE_cover_esp_log) <- FLORE_cover$REL
FLORE_cover_esp_log <- FLORE_cover_esp_log[
  rowSums(FLORE_cover_esp_log, na.rm = TRUE) > 0,
]
FLORE_cover_esp_log <- FLORE_cover_esp_log[,
  colSums(FLORE_cover_esp_log, na.rm = TRUE) > 0
]

#### Dendrogramme ----
dist_mat <- vegdist(FLORE_cover_esp_log, method = "bray") # création d'une matrie de distance avec la méthode de Bray-Curtis
dist_mat_sqrt <- sqrt(dist_mat) # rend la matrice de distance de BC en racine carrée
clust <- hclust(dist_mat_sqrt, method = "ward.D2") # Maximise la variance intra-groupe
groups <- cutree(clust, k = 4) # Décidé par observation

# DF REL + groupes
rel_groups <- tibble(
  REL = names(groups),
  Groupe = as.factor(groups)
)

# Joinure avec METADATA (X, Y)
rel_groups <- rel_groups %>%
  left_join(
    METADATA %>% select(REL, transect_numb, X, Y, Type_habitat),
    by = "REL"
  ) %>%
  arrange(Groupe, REL)

group_palette <- c(
  "1" = "#709CA7",
  "2" = "#D9A441",
  "3" = "#8BAF8D",
  "4" = "#C8574D",
  "5" = "#939597"
)

Télécharger ce graphique

ANOSIM (REL)

L’ANOSIM (test non-paramétrique) teste si les rangs dissimilarités entre-groupes > intra-groupes.

Package utilisé
- vegan

Code

anosim_res <- anosim(FLORE_cover_esp_log, groups, permutations = 999) # "999 permutations" permet d'être précis et rapide


Call:
anosim(x = FLORE_cover_esp_log, grouping = groups, permutations = 999) 
Dissimilarity: bray 

ANOSIM statistic R: 0.5005 
      Significance: 0.001 

Permutation: free
Number of permutations: 999

L’ANOSIM confirme une différence significative entre les 4 groupes de relevés (p_value = 0.001). Les rangs de dissimilartés Bray-Curtis entre groupe sont supérieurs aux rangs intra-groupes, avec une séparation modérée (R = 0.44) donc garde un certain gradient.

SIMPER (REL)

Le SIMPER (Clarke, 1993) identifie quelles espèces expliquent les différences entre les groupes, espèces indicatrices.

Package utilisé
- vegan

Code

simper_res <- simper(FLORE_cover_esp, factor(groups), permutations = 99)

characteristic_species <- top5_all(simper_res, top_n = 5)

df_simper <- map_dfr(
  1:6,
  ~ {
    x <- summary(simper_res, ordered = TRUE)[[.x]] %>%
      filter(p <= 0.01 & ratio > 1.0) %>%
      rownames_to_column("Espece")
    if (nrow(x) > 0) {
      mutate(x, Paire = names(summary(simper_res, ordered = TRUE))[.x])
    }
  },
  .id = "Rang"
) %>%
  select(Paire, Espece, average, ratio, p)

$`1`
x
               Ammophila arenaria            Corynephorus canescens 
                                3                                 3 
             Helichrysum stoechas                  Galium arenarium 
                                3                                 2 
Artemisia campestris ssp maritima                    Carex arenaria 
                                1                                 1 
                 Elytrigia juncea                Euphorbia paralias 
                                1                                 1 

$`2`
x
               Ammophila arenaria                  Galium arenarium 
                                3                                 3 
               Eryngium maritimum                Euphorbia paralias 
                                2                                 2 
Artemisia campestris ssp maritima            Convolvulus soldanella 
                                1                                 1 
           Corynephorus canescens                  Elytrigia juncea 
                                1                                 1 
             Helichrysum stoechas 
                                1 

$`3`
x
               Ammophila arenaria Artemisia campestris ssp maritima 
                                3                                 3 
               Eryngium maritimum                  Galium arenarium 
                                2                                 2 
                   Carex arenaria            Corynephorus canescens 
                                1                                 1 
                 Elytrigia juncea                Euphorbia paralias 
                                1                                 1 
             Helichrysum stoechas 
                                1 

$`4`
x
               Ammophila arenaria                  Elytrigia juncea 
                                3                                 3 
                 Galium arenarium                Eryngium maritimum 
                                3                                 2 
Artemisia campestris ssp maritima            Convolvulus soldanella 
                                1                                 1 
           Corynephorus canescens              Helichrysum stoechas 
                                1                                 1

Télécharger ce tableau

Boxplot contribution espèces indicatrices

Code

id_cols <- c("REL", "transect_numb")
species_cols_name <- setdiff(names(FLORE_cover), id_cols)

df_species <- FLORE_cover %>%
  select(all_of(c("REL", species_cols_name))) %>%
  pivot_longer(
    all_of(species_cols_name),
    names_to = "Espece",
    values_to = "Cover"
  ) %>%
  filter(Cover > 0)

df_species <- df_species %>%
  left_join(rel_groups %>% select(REL, Groupe), by = "REL")

# Ammophila arenaria
AA_contribution <- ggplot(
  df_species %>% filter(Espece == "Ammophila arenaria"), # sélectionne uniquement Ammophila
  aes(x = Groupe, y = Cover, fill = Groupe)
) +
  geom_boxplot() +
  stat_summary(fun = mean, geom = "point", size = 1, fill = "white") +
  scale_fill_manual(values = group_palette) +
  labs(
    title = "[Cover par REL/Groupe] Ammophila arenaria",
    x = "Groupe",
    y = "% Cover"
  ) +
  theme_minimal() +
  theme(legend.position = "none")

# Elytrigia juncea
EJ_contribution <- ggplot(
  df_species %>% filter(Espece == "Elytrigia juncea"),
  aes(x = Groupe, y = Cover, fill = Groupe)
) +
  geom_boxplot() +
  stat_summary(fun = mean, geom = "point", size = 1, fill = "white") +
  scale_fill_manual(values = group_palette) +
  labs(
    title = "[Cover par REL/Groupe] Elytrigia juncea",
    x = "Groupe",
    y = "% Cover"
  ) +
  theme_minimal() +
  theme(legend.position = "none")

# Helichrysum stoechas
HS_contribution <- ggplot(
  df_species %>% filter(Espece == "Helichrysum stoechas"),
  aes(x = Groupe, y = Cover, fill = Groupe)
) +
  geom_boxplot() +
  stat_summary(fun = mean, geom = "point", size = 1, fill = "white") +
  scale_fill_manual(values = group_palette) +
  labs(
    title = "[Cover par REL/Groupe] Helichrysum stoechas",
    x = "Groupe",
    y = "% Cover"
  ) +
  theme_minimal() +
  theme(legend.position = "none")

# Corynephorus canescens
CC_contribution <- ggplot(
  df_species %>% filter(Espece == "Corynephorus canescens"),
  aes(x = Groupe, y = Cover, fill = Groupe)
) +
  geom_boxplot() +
  stat_summary(fun = mean, geom = "point", size = 1, fill = "white") +
  scale_fill_manual(values = group_palette) +
  labs(
    title = "[Cover par REL/Groupe] Corynephorus canescens",
    x = "Groupe",
    y = "% Cover"
  ) +
  theme_minimal() +
  theme(legend.position = "none")

Télécharger ce graphique

Télécharger ce graphique

Télécharger ce graphique

Télécharger ce graphique

Diagramme de Venn (REL)

Le diagramme de Venn permet de visualiser les résultats du SIMPER.

Package utilisé
- VennDiagram

Code

#### Extraction espèces inditrices ----
extract_species_filtered <- function(simper_obj, top_n = 5, min_freq = 2) {
  species_list <- list()
  for (comp in names(simper_obj)) {
    df <- as.data.frame(simper_obj[[comp]])
    df <- df[order(-df$average), ] # tri décroissant
    top_species <- head(rownames(df), top_n) # top 5
    groups <- strsplit(comp, "_")[[1]]
    for (g in groups) {
      species_list[[g]] <- c(species_list[[g]], top_species)
    }
  }
  lapply(species_list, function(x) {
    freq <- sort(table(x), decreasing = TRUE)
    names(freq[freq >= min_freq])
  })
}

filtered_species <- extract_species_filtered(
  simper_res,
  top_n = 5,
  min_freq = 2
)

#### Visualisation ----
venn.plot <- venn.diagram(
  x = list(
    Groupe1 = filtered_species[["1"]],
    Groupe2 = filtered_species[["2"]],
    Groupe3 = filtered_species[["3"]],
    Groupe4 = filtered_species[["4"]]
  ),
  filename = NULL,
  fill = group_palette[as.character(1:4)],
  alpha = 0.4,
  cex = 1.2,
  cat.cex = 0.8,
  cat.fontface = "bold",
  margin = 0.1
)

2 espèces dans tous les groupes (Ammophila) Télécharger ce graphique

NMDS (REL)

Analyses multivariées avec un cadrage multidimentionnel (ici, 2 dimensions) non-paramétrique. Calcul des distances avec la méthode de Bray-Curtis, 100 essais. La détection des outliers se fait avec la méthode IQR (écart interquartile) de Tuckey (1977 in Lin et al., 2025). Tous les points de données qui se trouvent au-delà de 1,5 fois l’IQR en dessous du premier quartile ou au-dessus du troisième quartile sont exclus.

NMDS brute

Code

# 1. nMDS ordination
nmds <- metaMDS(FLORE_cover_esp_log, distance = "bray", k = 2, try = 100)

[1] "Stress = 0.103"

Code

# 2. Coordonées REL
nmds_points <- as.data.frame(scores(nmds, display = "sites"))
nmds_points$REL <- rownames(nmds_points)

# 3. Jointure groupes
nmds_points <- nmds_points %>%
  left_join(
    data.frame(REL = names(groups), Group = as.character(groups)),
    by = "REL"
  )
nmds_points <- nmds_points %>%
  filter(!is.na(NMDS1), !is.na(NMDS2))

La première visualisation met en évidence la présence d’outliers.

Télécharger ce graphique

Outliers

La méthode IQR est utilisée pour connaître les outliers.

Code

# Détection des outliers
detect_outliers <- function(data, var) {
  Q1 <- quantile(data[[var]], 0.25)
  Q3 <- quantile(data[[var]], 0.75)
  IQR_val <- Q3 - Q1
  lower <- Q1 - 1.5 * IQR_val
  upper <- Q3 + 1.5 * IQR_val
  outliers <- data[data[[var]] < lower | data[[var]] > upper, ]
  list(outliers = outliers, bounds = c(lower, upper))
}

outliers1 <- detect_outliers(nmds_points, "NMDS1")
outliers2 <- detect_outliers(nmds_points, "NMDS2")

Télécharger ce graphique

Code

nmds_clean <- nmds_points %>%
  filter(
    !row_number() %in% row.names(outliers1$outliers),
    !row_number() %in% row.names(outliers2$outliers)
  )

# 5. Enveloppes
hulls <- nmds_clean %>%
  group_by(Group) %>%
  filter(n() >= 3) %>%
  slice(chull(NMDS1, NMDS2)) %>%
  ungroup()

# 6. Visualisation + limites
NMDS_clean <- ggplot(nmds_clean, aes(x = NMDS1, y = NMDS2, color = Group)) +
  geom_polygon(
    data = hulls,
    aes(fill = Group),
    alpha = 0.3,
    color = 'NA',
    linewidth = 0.5
  ) +
  geom_point(size = 2, alpha = 0.7) +
  xlim(-0.015, 0.01) +
  ylim(-0.01, 0.01) + # limites manuelles
  scale_color_manual(values = group_palette) +
  scale_fill_manual(values = group_palette) +
  theme_minimal() +
  labs(title = "Ordination NMDS", x = "NMDS1", y = "NMDS2")

Télécharger ce graphique

Heatmap (REL)

Packages uilisés
- pheatmap
- RColorBrewer

Code

#### Préparation data ----
annotation_col <- data.frame(Cluster = factor(groups))
rownames(annotation_col) <- names(groups)
freq <- colSums(FLORE_cover_esp_log > 0, na.rm = TRUE)
cols_heat <- colorRampPalette(c("#FFFFFF", "#CE6A6B"))(100)
ann_colors <- list(Cluster = group_palette)

#### Visualisation ----
heatmap <- pheatmap(
  t(FLORE_cover_esp_log),
  color = cols_heat,
  cluster_rows = FALSE,
  cluster_cols = clust,
  annotation_col = annotation_col,
  fontsize = 3,
  annotation_colors = ann_colors,
  show_rownames = TRUE, # Afficher nom espèces
  show_colnames = TRUE, # Afficher nom REL
  main = paste("Heatmap transposée (z-score) -", 5, "groupes")
)

Code

heatmap

La heatmap est illisble à cause du nombre d’espèces et du nombre du relevés. La heatmap suivante se concentre sur les 30 espèces les plus abondantes.

Télécharger ce graphique

Code

#### Préparation data ----
top_species <- names(sort(freq, decreasing = TRUE))[1:30]

comm_top <- as.matrix(FLORE_cover_esp_log[, top_species])
comm_top_scaled <- t(scale(t(comm_top)))
comm_top_clean <- comm_top_scaled[complete.cases(comm_top_scaled), ]
comm_top_clean <- comm_top_clean[, complete.cases(t(comm_top_clean))]

rel_clean <- rownames(comm_top_clean)
annotation_clean <- annotation_col[
  rownames(annotation_col) %in% rel_clean,
  ,
  drop = FALSE
]

clust_clean <- hclust(dist(t(comm_top_clean)), method = "ward.D2")
ord_cols <- clust_clean$order

#### Visualisation ----
pheatmap(
  t(comm_top_clean)[, ord_cols],
  color = cols_heat,
  cluster_rows = FALSE,
  cluster_cols = FALSE,
  annotation_col = annotation_clean[ord_cols, , drop = FALSE],
  annotation_colors = ann_colors,
  show_rownames = TRUE,
  show_colnames = TRUE,
  main = "Top 30 espèces - Z-score (Ward.D2)"
)

Télécharger ce graphique

Analyses exploratoires (par transect)

Matrice par transect

Code

FLORE_cover_esp_transect <- FLORE_cover_esp
FLORE_cover_min <- FLORE_cover[
  rowSums(FLORE_cover[, -c(1, 2)], na.rm = TRUE) > 0,
]
FLORE_cover_esp_transect$transect <- FLORE_cover_min$transect_numb
# FLORE_cover_esp_transect <- FLORE_cover_esp_transect[, c("transect", names(FLORE_cover_esp))]

FLORE_transect_esp <- FLORE_cover_esp_transect %>%
  group_by(transect) %>%
  summarise(across(where(is.numeric), mean, na.rm = TRUE)) %>% # ici, mean car le nombre de transect est différent par transect
  ungroup()

# matrice avec nom des lignes = transect
FLORE_transect_esp_mat <- as.matrix(FLORE_transect_esp[, -1])
rownames(FLORE_transect_esp_mat) <- FLORE_transect_esp$transect

# transformation en log
FLORE_transect_log <- log1p(FLORE_transect_esp_mat)
FLORE_transect_log <- FLORE_transect_log[
  rowSums(FLORE_transect_log, na.rm = TRUE) > 0,
]

Télécharger ce tableau

Dendrogramme (TRANSECT)

Code

#### Préparation data ----
dist_transect <- vegdist(FLORE_transect_log, method = "bray")
clust_transect <- hclust(dist_transect, method = "ward.D2")
groups_transect <- cutree(clust_transect, k = 5)

Télécharger ce graphique

ANOSIM (TRANSECT)

Code

anosim_transect <- anosim(
  FLORE_transect_log,
  groups_transect,
  permutations = 999
)


Call:
anosim(x = FLORE_transect_log, grouping = groups_transect, permutations = 999) 
Dissimilarity: bray 

ANOSIM statistic R: 0.5902 
      Significance: 0.001 

Permutation: free
Number of permutations: 999

SIMPER (TRANSECT)

Code

simper_transect <- simper(
  FLORE_transect_esp_mat,
  factor(groups_transect),
  permutations = 99
)

characteristic_species_transect <- top5_all(simper_transect, top_n = 5)

$`1`
x
               Ammophila arenaria                  Elytrigia juncea 
                                4                                 4 
             Helichrysum stoechas Artemisia campestris ssp maritima 
                                3                                 2 
               Euphorbia paralias                  Galium arenarium 
                                2                                 2 
                   Carex arenaria                Eryngium maritimum 
                                1                                 1 
               Festuca juncifolia 
                                1 

$`2`
x
               Ammophila arenaria Artemisia campestris ssp maritima 
                                4                                 4 
                 Elytrigia juncea                Eryngium maritimum 
                                4                                 2 
                 Galium arenarium              Helichrysum stoechas 
                                2                                 2 
                   Carex arenaria                Festuca juncifolia 
                                1                                 1 

$`3`
x
               Ammophila arenaria              Helichrysum stoechas 
                                4                                 4 
                 Elytrigia juncea Artemisia campestris ssp maritima 
                                3                                 2 
               Euphorbia paralias                Festuca juncifolia 
                                2                                 2 
                 Galium arenarium                    Carex arenaria 
                                2                                 1 

$`4`
x
               Ammophila arenaria                  Elytrigia juncea 
                                4                                 4 
                 Galium arenarium Artemisia campestris ssp maritima 
                                4                                 2 
               Euphorbia paralias              Helichrysum stoechas 
                                2                                 2 
                   Carex arenaria                Eryngium maritimum 
                                1                                 1 

$`5`
x
               Ammophila arenaria Artemisia campestris ssp maritima 
                                4                                 4 
                   Carex arenaria                  Galium arenarium 
                                4                                 4 
                 Elytrigia juncea              Helichrysum stoechas 
                                3                                 1

Diagramme de Venn (TRANSECT)

Le diagramme de Venn permet de visualiser les résultats du SIMPER.

Package utilisé
- VennDiagram

Code

#### Préparation data ----
extract_species_filtered_transect <- function(
  simper_obj,
  top_n = 5,
  min_freq = 2
) {
  species_list <- list()
  for (comp in names(simper_obj)) {
    df <- as.data.frame(simper_obj[[comp]])
    df <- df[order(-df$average), ] # tri décroissant
    top_species <- head(rownames(df), top_n) # top 5
    groups <- strsplit(comp, "_")[[1]]
    for (g in groups) {
      species_list[[g]] <- c(species_list[[g]], top_species)
    }
  }
  lapply(species_list, function(x) {
    freq <- sort(table(x), decreasing = TRUE)
    names(freq[freq >= min_freq])
  })
}

filtered_species_transect <- extract_species_filtered_transect(
  simper_transect,
  top_n = 5,
  min_freq = 2
)

#### Visualisation ----
venn.plot_transect <- venn.diagram(
  x = list(
    Groupe1 = filtered_species_transect[["1"]],
    Groupe2 = filtered_species_transect[["2"]],
    Groupe3 = filtered_species_transect[["3"]],
    Groupe4 = filtered_species_transect[["4"]],
    Groupe5 = filtered_species_transect[["5"]]
  ),
  filename = NULL,
  fill = group_palette[as.character(1:5)],
  alpha = 0.4,
  cex = 1.2,
  cat.cex = 0.8,
  cat.fontface = "bold",
  margin = 0.1
)

Télécharger ce graphique

NMDS (TRANSECT)

Code

#### Préparation data ----
nmds_transect <- metaMDS(
  FLORE_transect_log,
  distance = "bray",
  k = 2,
  try = 100
)

[1] "Stress = 0.244"

Code

nmds_tr_pts <- as.data.frame(scores(nmds_transect, display = "sites"))
nmds_tr_pts$Transect <- rownames(nmds_tr_pts)
nmds_tr_pts$Group <- factor(groups_transect[nmds_tr_pts$Transect])

# Hulls
hulls_tr <- nmds_tr_pts %>%
  group_by(Group) %>%
  slice(chull(NMDS1, NMDS2))

Télécharger ce graphique

Heatmap (TRANSECT)

Code

# Fréquences globales
freq_tr <- colSums(FLORE_transect_log > 0, na.rm = TRUE)
top_species_tr <- names(sort(freq_tr, decreasing = TRUE))[1:30]

comm_tr_top <- as.matrix(FLORE_transect_log[, top_species_tr])
comm_tr_scaled <- t(scale(t(comm_tr_top)))
comm_tr_clean <- comm_tr_scaled[complete.cases(comm_tr_scaled), ]
comm_tr_clean <- comm_tr_clean[, complete.cases(t(comm_tr_clean))]

# Annotation transects
annotation_tr <- data.frame(
  Cluster = factor(groups_transect[rownames(comm_tr_clean)])
)
rownames(annotation_tr) <- rownames(comm_tr_clean)

# Clustering Ward sur transects (z-scores)
clust_tr_clean <- hclust(dist(comm_tr_clean), method = "ward.D2")

library(pheatmap)
cols_heat <- colorRampPalette(c("#FFFFFF", "#CE6A6B"))(100)
ann_colors_tr <- list(Cluster = group_palette)

Télécharger ce graphique

Analyses diversité spécifique

Package utilisé
- dplyr
- vegan
- ggplot2

Richesse spécifique

La richesse spécifique a été calculée pour chaque relevé puis les résultats ont été emboités à la matrice METADATA.

Code

Richesse spécifique

# Richesse spé par relevé
richesse_rel <- data.frame(
  REL = FLORE_cover$REL,
  Richesse = rowSums(FLORE_cover[, species_cols] > 0, na.rm = TRUE)
) %>%
  mutate(Richesse = Richesse)

METADATA <- METADATA %>%
  left_join(richesse_rel, by = "REL")

Indice de Shannon

En utilisant le recouvrement moyen (%), l’indice de Shannon a été calculé pour chaque relevé puis les résultats ont été emboités à la matrice METADATA.

Code

Shannon

shannon_rel <- diversity(FLORE_cover[, species_cols], index = "shannon")

METADATA <- METADATA %>%
  left_join(
    data.frame(REL = FLORE_cover$REL, Shannon = shannon_rel),
    by = "REL"
  )

L’indice de Shannon a ensuite été moyenné par transect.

Code

Shannon par transect

# Shannon par transect
shannon_transect <- METADATA %>%
  group_by(transect_numb) %>%
  summarise(
    shannon_moy = mean(Shannon),
    shannon_sd = sd(Shannon),
    n_releves = n(),
    .groups = "drop"
  )

Inverse de Simpson

En utilisant le recouvrement moyen (%), l’inverse de Simpson a été calculé pour chaque relevé puis les résultats ont été emboités à la matrice METADATA.

Code

Inverse de Simpson

Simpson_inv_rel <- diversity(FLORE_cover[, species_cols], index = "invsimpson")

METADATA <- METADATA %>%
  left_join(
    data.frame(REL = FLORE_cover$REL, Simpson_inv_rel = Simpson_inv_rel),
    by = "REL"
  )

OUTPUT
- richesse_rel [453 x 2] : richesse spécifique S (0D) par relevé. - shannon_rel [453 x 2] : indice de Shannon H’ (1D) par relevé. - res_shannon [94 x 4] : indice de Shannon H’ (1D) par transect. - Simpson_inv_rel : inverse de Simpson (2D) par relevé.

Télécharger ce tableau

Enfin, une droite de régression a été tracée entre les deux indices (Shannon ~ Richesse).

Code

shannon ~ richesse

plot(Shannon ~ Richesse, data = METADATA)

Code

lm(Shannon ~ Richesse, data = METADATA)


Call:
lm(formula = Shannon ~ Richesse, data = METADATA)

Coefficients:
(Intercept)     Richesse  
    0.43714      0.09817

Code

ggplot(METADATA, aes(x = Richesse, y = Shannon)) +
  geom_point(alpha = 0.6, color = "bisque3") +
  geom_smooth(method = "lm", se = TRUE, color = "aquamarine4", size = 1.2) +
  labs(
    title = "Richesse spécifique vs Indice de Shannon (2021)",
    x = "Richesse spécifique S",
    y = "Indice de Shannon H'"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 14)
  )

Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
ℹ Please use `linewidth` instead.

`geom_smooth()` using formula = 'y ~ x'

Transects

Un tableau est créé pour avoir le nombre de relevés, le nombre d’habitat, le nombre de faciès et la richesse spécifique pour chaque transect.

Package utilisé
- dplyr

Code

# Création d'un dataset
METADATA_transect <- METADATA %>%
  group_by(transect_numb) %>%
  mutate(
    Simpson_inv_rel = ifelse(
      is.infinite(Simpson_inv_rel),
      Richesse,
      Simpson_inv_rel
    )
  ) %>%
  summarise(
    n_releves = n(),
    n_habitats = n_distinct(Type_habitat, na.rm = TRUE),
    n_facies = n_distinct(id_facies, na.rm = TRUE),
    Richesse_moy = mean(Richesse, na.rm = TRUE),
    Richesse_sd = sd(Richesse, na.rm = TRUE),
    Shannon_moy = mean(Shannon, na.rm = TRUE),
    Shannon_sd = sd(Shannon, na.rm = TRUE),
    Simpson_moy = mean(Simpson_inv_rel, na.rm = TRUE),
    Simpson_sd = sd(Simpson_inv_rel, na.rm = TRUE),
    .groups = "drop"
  ) %>%
  arrange(transect_numb)

OUTPUT
- METADATA_transect [94 x 4] : pour chaque transect, nombre de relevés, nombre d’habitats, nombre de faciès et les indices 0D, 1D et 2D (moyenne et écart-type).

Télécharger ce tableau

Nombres de Hill

Les nombres de Hill permettent de mesurer la diversité d’une communauté de manière cohérente entre indices et directement interprétable en nombre d’espèces effectives. Ils mettent la richesse spécifique, Shannon et Simpson sur la même échelle (ordres q), comparables entre eux.

Packages utilisés
- dplyr
- tidyr

Code

#### Diversité spécifique ----
Hill_0s <- richesse_rel$Richesse
Hill_1s <- exp(shannon_rel)
Hill_2s <- Simpson_inv_rel

#### Dataset Hill Spécifique
Hill_spe_transect <- METADATA %>%
  group_by(transect_numb) %>%
  mutate(
    Simpson_inv_corr = ifelse(is.infinite(Simpson_inv_rel), 1, Simpson_inv_rel)
  ) %>%
  # Résultats 'inf' dans les valeurs de l'inverse de Simpson donc correction
  summarise(
    Hill0_moy = mean(Richesse, na.rm = TRUE),
    Hill0_sd = sd(Richesse, na.rm = TRUE),
    Hill1_moy = mean(exp(Shannon), na.rm = TRUE),
    Hill1_sd = sd(exp(Shannon), na.rm = TRUE),
    Hill2_moy = mean(Simpson_inv_corr, na.rm = TRUE), # Utilisation de la correction
    Hill2_sd = sd(Simpson_inv_corr, na.rm = TRUE), # pour ne plus avoir de 'inf'
    n_releves = n(),
    .groups = "drop"
  )

Hill_transect_long <- Hill_spe_transect %>%
  select(transect_numb, Hill0_moy, Hill1_moy, Hill2_moy) %>%
  pivot_longer(
    cols = starts_with("Hill"),
    names_to = "Indice",
    values_to = "Valeur"
  )

OUTPUT
- Hill_xs : vecteurs des 3 ordres de nombres de Hill représentant la richesse spécifique (0D), l’indice de Shannon en exp (1D) et l’inverse de Simpson (2D).
- Hill_transect : dataframe des indices de diversité spéicifique sous nombres de Hill par transect.
- Hill_transect_long : dataframe en long.

Télécharger ce tableau

Package utilisé
- ggplot2

Code

graph_diversite <- ggplot(
  Hill_transect_long,
  aes(x = transect_numb, y = Valeur, color = Indice, group = Indice)
) +
  geom_line(size = 1) +
  geom_point(size = 1.5) +
  labs(
    x = "Transect",
    y = "Nombre de Hill moyen (0D, 1D, 2D)",
    title = "Diversité spécifique d'ordre 0, 1 et 2 par transect"
  ) +
  theme_minimal() +
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),
    plot.title = element_text(hjust = 0.5)
  )

Télécharger ce graphique

Code

cor(
  Hill_spe_transect$Hill0_moy,
  Hill_spe_transect$Hill1_moy,
  use = "complete.obs"
)

[1] 0.9037351

Code

cor(
  Hill_spe_transect$Hill0_moy,
  Hill_spe_transect$Hill2_moy,
  use = "complete.obs"
)

[1] 0.8512431

Code

cor(
  Hill_spe_transect$Hill1_moy,
  Hill_spe_transect$Hill2_moy,
  use = "complete.obs"
)

[1] 0.9834085

--- title: "Diversité spécifique" author: "Ludivine Codoner" date: today date-format: "YYYY-MM-DD" format: html: code-tools: true toc: true toc-float: true theme: minty highlight-style: tango code-fold: show code-overflow: wrap --- # Packages ```{r packages utilisés, message=FALSE} source("03.script/00_packages.R") ``` # Structuration des données ## Importation - DATA Les données proviennent d'un tableau Excel (.xlsx). **Package utilisé**\ - *readxl* ```{r importation du df complet brut, message=FALSE, warning=FALSE, include=FALSE} # Ici, on importe le tableau de données SANS les "cf" path_res <- "D:/Master 2/S10/stagem2_lcodoner/04.results" source("03.script/01_import.R") ``` **OUTPUT**\ - *DATA \[402 x 3824\]:* dataframe contenant l'ensemble des données floristiques et des métadonnées. ## METADATA et FLORE Les données brutes sont coupées pour ne garder que les relevés de 2021 (DATA_21), correspondant aux derniers relevés en date. A cette date, les relevés ont également été effectué en Charente-Maritime, ceux-ci ont aussi été enlevés. **Packages utilisés**\ - *dplyr*\ - *stringr* ```{r création METADATA et FLORE} source("03.script/02_cleaning.R") ``` **OUTPUT**\ - *DATA_21 \[401 x 454\] :* dataframe contenant les métadonnées et les relevés floristiques de 2021 et uniquement de la Gironde et des Landes.\ - *METADATA \[453 x 64\] :* contient les variables environnementales et logistiques.\ - *FLORE \[453 x 343\] :* contient les valeurs de coefficient de Braun-Blanquet pour chaque relevé et chaque espèce. ```{r} source("03.script/03_functions.R") ``` # Analyses descriptives Informations descriptives du jeu de données. Nombre d'espèces recensées en 2021 et leur occurence dans les relevés et les transects. :::{.panel-tabset} #### Script **Package utilisé**\ - *dplyr* ```{r Analyses descriptives} species_cols <- !colnames(FLORE) %in% c("transect_numb", "REL") # Pour ne convertir que les esp # Richesse spécifique 2021 richesse_all <- sum(colSums(FLORE[, species_cols] != "", na.rm = TRUE) > 0) # 109 # Liste des espèces recensées (présentes au moins une fois) esp_recensees <- colnames(FLORE[, species_cols])[ colSums(FLORE[, species_cols] != "", na.rm = TRUE) > 0 ] # Analyses exploratoires espèce-centrée Recensement <- tibble( Espèce = esp_recensees, Nb_relevés = colSums(FLORE[, esp_recensees] != "", na.rm = TRUE) ) %>% # espèces + nombre de relevés où elles sont présentes mutate( Nb_Transects = sapply(esp_recensees, function(sp) { length(unique(FLORE$transect_numb[FLORE[[sp]] != ""])) }) - 1 ) %>% # nombre de transects où chaque espèce est présente arrange(desc(Nb_relevés)) # les espèces les plus fréquentes au début ``` #### Tableau {.active} ```{r descriptives res, echo = FALSE} write_xlsx( Recensement, path = file.path(path_res, "Recensement.xlsx") ) datatable(Recensement) ``` [Télécharger ce tableau](../04.results/Recensement.xlsx){.btn .btn-outline-primary} ::: **OUTPUT**\ - *richesse_all :* richesse spécifique sur l'ensemble des données 2021.\ - *esp_recensees :* liste des espèces présentes au moins une fois dans les données.\ - *Recensement :* pour chaque espèce, nombre de relevés et le nombre de transects dans lesquelles elle apparaît. # Analyses exploratoires (par relevés) ## Faciès :::{.panel-tabset} #### Script ```{r facies} facies <- METADATA %>% filter(!is.na(Type_habitat)) %>% count(Type_habitat, sort = TRUE) ``` #### Chi² ```{r chi2} chisq.test(facies$n) ``` #### Tableau {.active} ```{r facies res, echo = FALSE} write_xlsx( facies, path = file.path(path_res, "facies.xlsx") ) datatable(facies) ``` [Télécharger ce tableau](../04.results/facies.xlsx){.btn .btn-outline-primary} ::: ## Braun-Blanquet -\> % recouvrement Le coefficient de Braun-Blanquet est composé de classes de présence correspondant à des fréquences relatives (%). Pour analyser ces données, les valeurs d'abondance-dominance selon Braun-Blanquet (1932) ont été remplacées par le recouvrement moyen (%), comme présenté par Dufrêne (1998 in **Meddour 2011**) via la fonction *bb_to_cover*. :::{.panel-tabset} #### Script **Package utilisé**\ - *dplyr* ```{r bb to % cover} #### FLORE_cover ---- FLORE_cover <- apply(FLORE[, species_cols], 2, bb_to_cover) # applique la fonction à toutes les colonnes espèces de FLORE -> matrice % recouvrement FLORE_cover <- as.data.frame(FLORE_cover) # matrce -> dataframe FLORE_cover[is.na(FLORE_cover)] <- 0 # Remplace les NA par 0 pour calculer Shannon FLORE_cover$REL <- FLORE$REL # ajoute colone REL depuis FLORE FLORE_cover$transect_numb <- FLORE$transect_numb # ajoute colonne transect depuis FLORE FLORE_cover <- FLORE_cover %>% select(REL, transect_numb, everything()) # Met le numéro du relevé et du transect en premières colonnes ##### REL_to_transect ---- # REL_to_transect permet de garder un tableau de conversion REL_to_transect <- FLORE %>% select(REL, transect_numb) %>% distinct() # table de jointure ``` **OUTPUT**\ - *bb_to_cover :* fonction qui convertit le coefficient de Braun-Blanquet (Braun-Blanquet, 1932) en % de recouvrement moyen (Dufrêne 1998 in Meddour 2011).\ - *species_cols :* vecteur logique pour séparer les colonnes d'esp avec les autres colonnes. Permet de sélectionner uniquement les colonnes d'espèces.\ - *FLORE_cover \[453 x 343\] :* dataframe avec le recouvrement moyen (%) des espèces en fontion des relevés.\ - *REL_to_transect \[453 x 2\] :* dataframe permettat la mise en relation des relevés avec le transect correspondant. #### Tableau {.active} ```{r, echo = FALSE} write_xlsx( REL_to_transect, path = file.path(path_res, "REL_to_transect.xlsx") ) datatable(REL_to_transect) ``` [Télécharger ce tableau](../04.results/REL_to_transect.xlsx){.btn .btn-outline-primary} ::: ## Dendrogramme (REL) Utilisation de dataframe *FLORE_cover_esp* transformé en log -réduit l'effet des dominants- afin d'obtenir une matrice de distance avec la méthode de Bray-Curtis (Bray & Curtis, 1957). La méthode Bray-Curtis est utilisée pour mesurer les différences en abondances entre relevés. La métrique de distance Bray-Crutis est non-métrique, c'est pourquoi elle ne peut pas être utilisé avec l'algorithme de regroupe de Ward qui nécessite une distance métrique. Pour cela, les résultats Bray-Curtis sont transformés en racine carrée. Les clusters sont créés via la méthode de Ward.D2 qui maximise la variance intra-groupe. :::{.panel-tabset} #### Script **Packages utilisés**\ - *vegdist*\ - *dendextend* ```{r dendrogramme} #### Préparation data ---- FLORE_cover_esp <- FLORE_cover[, species_cols] FLORE_cover_esp <- FLORE_cover_esp[rowSums(FLORE_cover_esp, na.rm = TRUE) > 0, ] FLORE_cover_esp <- FLORE_cover_esp[, colSums(FLORE_cover_esp, na.rm = TRUE) > 0] FLORE_cover_esp_log <- log1p(FLORE_cover[, species_cols]) # Réduction des effets des dominants rownames(FLORE_cover_esp_log) <- FLORE_cover$REL FLORE_cover_esp_log <- FLORE_cover_esp_log[ rowSums(FLORE_cover_esp_log, na.rm = TRUE) > 0, ] FLORE_cover_esp_log <- FLORE_cover_esp_log[, colSums(FLORE_cover_esp_log, na.rm = TRUE) > 0 ] #### Dendrogramme ---- dist_mat <- vegdist(FLORE_cover_esp_log, method = "bray") # création d'une matrie de distance avec la méthode de Bray-Curtis dist_mat_sqrt <- sqrt(dist_mat) # rend la matrice de distance de BC en racine carrée clust <- hclust(dist_mat_sqrt, method = "ward.D2") # Maximise la variance intra-groupe groups <- cutree(clust, k = 4) # Décidé par observation # DF REL + groupes rel_groups <- tibble( REL = names(groups), Groupe = as.factor(groups) ) # Joinure avec METADATA (X, Y) rel_groups <- rel_groups %>% left_join( METADATA %>% select(REL, transect_numb, X, Y, Type_habitat), by = "REL" ) %>% arrange(Groupe, REL) group_palette <- c( "1" = "#709CA7", "2" = "#D9A441", "3" = "#8BAF8D", "4" = "#C8574D", "5" = "#939597" ) ``` #### Résultats {.active} ```{r Dendrogramme res, echo = FALSE} plot( color_branches(as.dendrogram(clust), k = 4, col = group_palette[1:4]), main = "Dendrogramme coloré (Ward)", xlab = "REL", cex = 0.4 ) ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/Dendrogramme res-1.png){.btn .btn-outline-primary} ::: ## ANOSIM (REL) L'ANOSIM (test non-paramétrique) teste si les rangs dissimilarités entre-groupes \> intra-groupes. :::{.panel-tabset} #### Script **Package utilisé**\ - *vegan* ```{r ANOSIM} anosim_res <- anosim(FLORE_cover_esp_log, groups, permutations = 999) # "999 permutations" permet d'être précis et rapide ``` #### Résultats {.active} ```{r ANOSIM res, echo = FALSE} anosim_res ``` ::: L'ANOSIM confirme une différence significative entre les 4 groupes de relevés (*p_value* = 0.001). Les rangs de dissimilartés Bray-Curtis entre groupe sont supérieurs aux rangs intra-groupes, avec une séparation modérée (R = 0.44) donc garde un certain gradient. ## SIMPER (REL) Le SIMPER (Clarke, 1993) identifie quelles espèces expliquent les différences entre les groupes, espèces indicatrices. :::{.panel-tabset} #### Script **Package utilisé**\ - *vegan* ```{r SIMPER} simper_res <- simper(FLORE_cover_esp, factor(groups), permutations = 99) characteristic_species <- top5_all(simper_res, top_n = 5) df_simper <- map_dfr( 1:6, ~ { x <- summary(simper_res, ordered = TRUE)[[.x]] %>% filter(p <= 0.01 & ratio > 1.0) %>% rownames_to_column("Espece") if (nrow(x) > 0) { mutate(x, Paire = names(summary(simper_res, ordered = TRUE))[.x]) } }, .id = "Rang" ) %>% select(Paire, Espece, average, ratio, p) ``` #### Résultats bruts ```{r SIMPER res brut, echo = FALSE} characteristic_species ``` #### Tableau {.active} ```{r SIMPER res, echo = FALSE} write_xlsx( df_simper, path = file.path(path_res, "df_simper.xlsx") ) datatable(df_simper) ``` [Télécharger ce tableau](../04.results/df_simper.xlsx){.btn .btn-outline-primary} ::: ## Boxplot contribution espèces indicatrices :::{.panel-tabset} #### Script ```{r Boxplot contribution} id_cols <- c("REL", "transect_numb") species_cols_name <- setdiff(names(FLORE_cover), id_cols) df_species <- FLORE_cover %>% select(all_of(c("REL", species_cols_name))) %>% pivot_longer( all_of(species_cols_name), names_to = "Espece", values_to = "Cover" ) %>% filter(Cover > 0) df_species <- df_species %>% left_join(rel_groups %>% select(REL, Groupe), by = "REL") # Ammophila arenaria AA_contribution <- ggplot( df_species %>% filter(Espece == "Ammophila arenaria"), # sélectionne uniquement Ammophila aes(x = Groupe, y = Cover, fill = Groupe) ) + geom_boxplot() + stat_summary(fun = mean, geom = "point", size = 1, fill = "white") + scale_fill_manual(values = group_palette) + labs( title = "[Cover par REL/Groupe] Ammophila arenaria", x = "Groupe", y = "% Cover" ) + theme_minimal() + theme(legend.position = "none") # Elytrigia juncea EJ_contribution <- ggplot( df_species %>% filter(Espece == "Elytrigia juncea"), aes(x = Groupe, y = Cover, fill = Groupe) ) + geom_boxplot() + stat_summary(fun = mean, geom = "point", size = 1, fill = "white") + scale_fill_manual(values = group_palette) + labs( title = "[Cover par REL/Groupe] Elytrigia juncea", x = "Groupe", y = "% Cover" ) + theme_minimal() + theme(legend.position = "none") # Helichrysum stoechas HS_contribution <- ggplot( df_species %>% filter(Espece == "Helichrysum stoechas"), aes(x = Groupe, y = Cover, fill = Groupe) ) + geom_boxplot() + stat_summary(fun = mean, geom = "point", size = 1, fill = "white") + scale_fill_manual(values = group_palette) + labs( title = "[Cover par REL/Groupe] Helichrysum stoechas", x = "Groupe", y = "% Cover" ) + theme_minimal() + theme(legend.position = "none") # Corynephorus canescens CC_contribution <- ggplot( df_species %>% filter(Espece == "Corynephorus canescens"), aes(x = Groupe, y = Cover, fill = Groupe) ) + geom_boxplot() + stat_summary(fun = mean, geom = "point", size = 1, fill = "white") + scale_fill_manual(values = group_palette) + labs( title = "[Cover par REL/Groupe] Corynephorus canescens", x = "Groupe", y = "% Cover" ) + theme_minimal() + theme(legend.position = "none") ``` #### A. arenaria {.active} ```{r AA contribution, echo = FALSE} AA_contribution ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/AA contribution-1.png){.btn .btn-outline-primary} #### E. juncea ```{r EJ contribution, echo = FALSE} EJ_contribution ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/EJ contribution-1.png){.btn .btn-outline-primary} #### H. stoechas ```{r HS contribution, echo = FALSE} HS_contribution ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/HS contribution-1.png){.btn .btn-outline-primary} #### C. canescens ```{r CC contribution, echo = FALSE} CC_contribution ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/CC contribution-1.png){.btn .btn-outline-primary} ::: ## Diagramme de Venn (REL) Le diagramme de Venn permet de visualiser les résultats du SIMPER. :::{.panel-tabset} #### Script **Package utilisé**\ - *VennDiagram* ```{r Diagramme de Venn} #### Extraction espèces inditrices ---- extract_species_filtered <- function(simper_obj, top_n = 5, min_freq = 2) { species_list <- list() for (comp in names(simper_obj)) { df <- as.data.frame(simper_obj[[comp]]) df <- df[order(-df$average), ] # tri décroissant top_species <- head(rownames(df), top_n) # top 5 groups <- strsplit(comp, "_")[[1]] for (g in groups) { species_list[[g]] <- c(species_list[[g]], top_species) } } lapply(species_list, function(x) { freq <- sort(table(x), decreasing = TRUE) names(freq[freq >= min_freq]) }) } filtered_species <- extract_species_filtered( simper_res, top_n = 5, min_freq = 2 ) #### Visualisation ---- venn.plot <- venn.diagram( x = list( Groupe1 = filtered_species[["1"]], Groupe2 = filtered_species[["2"]], Groupe3 = filtered_species[["3"]], Groupe4 = filtered_species[["4"]] ), filename = NULL, fill = group_palette[as.character(1:4)], alpha = 0.4, cex = 1.2, cat.cex = 0.8, cat.fontface = "bold", margin = 0.1 ) ``` #### Résultats {.active} ```{r VennDiagram res, echo = FALSE} grid.newpage() grid.draw(venn.plot) ``` 2 espèces dans tous les groupes (*Ammophila*) [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/Dendrogramme de Venn-1.png){.btn .btn-outline-primary} ::: ## NMDS (REL) Analyses multivariées avec un cadrage multidimentionnel (ici, 2 dimensions) non-paramétrique. Calcul des distances avec la méthode de Bray-Curtis, 100 essais. La détection des outliers se fait avec la méthode IQR (écart interquartile) de Tuckey (1977 in Lin et al., 2025). Tous les points de données qui se trouvent au-delà de 1,5 fois l'IQR en dessous du premier quartile ou au-dessus du troisième quartile sont exclus. ### NMDS brute :::{.panel-tabset} **Packages utilisés**\ - *ggplot2*\ - *ggrepel* #### Script ```{r nMDS, output = FALSE} # 1. nMDS ordination nmds <- metaMDS(FLORE_cover_esp_log, distance = "bray", k = 2, try = 100) ``` ```{r, echo = FALSE} print(paste("Stress =", round(nmds$stress, 3))) # stress = 0.103 -> bon selon Clarke (1993) ``` ```{r} # 2. Coordonées REL nmds_points <- as.data.frame(scores(nmds, display = "sites")) nmds_points$REL <- rownames(nmds_points) # 3. Jointure groupes nmds_points <- nmds_points %>% left_join( data.frame(REL = names(groups), Group = as.character(groups)), by = "REL" ) nmds_points <- nmds_points %>% filter(!is.na(NMDS1), !is.na(NMDS2)) ``` #### Résultats {.active} La première visualisation met en évidence la présence d'outliers. ```{r NMDS error, echo = FALSE, message = FALSE} # 4. Visualisation ggplot(nmds_points, aes(x = NMDS1, y = NMDS2, color = Group)) + geom_point(size = 3, alpha = 0.7) + scale_color_manual(values = group_palette) + geom_text_repel( data = slice_sample(nmds_points, n = 20), # 20 labels aléatoires aes(label = REL), size = 3, max.overlaps = 20 ) + # scale_fill_manual(values = group_palette) + theme_minimal(base_size = 12) + labs( title = paste("NMDS FLORE_cover - Stress =", round(nmds$stress, 3)), color = "Groupe" ) + theme(legend.position = "right") #theme(plot.title = element_text(hjust = 0.5, face = "bold")) ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/NMDS error-1.png){.btn .btn-outline-primary} ::: ### Outliers :::{.panel-tabset} #### Script La méthode IQR est utilisée pour connaître les outliers. ```{r NMDS outliers script} # Détection des outliers detect_outliers <- function(data, var) { Q1 <- quantile(data[[var]], 0.25) Q3 <- quantile(data[[var]], 0.75) IQR_val <- Q3 - Q1 lower <- Q1 - 1.5 * IQR_val upper <- Q3 + 1.5 * IQR_val outliers <- data[data[[var]] < lower | data[[var]] > upper, ] list(outliers = outliers, bounds = c(lower, upper)) } outliers1 <- detect_outliers(nmds_points, "NMDS1") outliers2 <- detect_outliers(nmds_points, "NMDS2") ``` #### Tableaux ```{r, echo = FALSE, filename = "NMDS1"} datatable(outliers1$outliers %>% select(REL, Group)) # Identifiez-les par REL/Group ``` ```{r, echo = FALSE, filename = "NMDS2"} datatable(outliers2$outliers %>% select(REL, Group)) ``` #### Résultats {.active} ```{r NMDS outliers res, echo = FALSE} ggplot(nmds_points, aes(x = NMDS1, y = NMDS2, color = Group)) + geom_point(alpha = 0.7) + geom_point( data = outliers1$outliers, aes(color = "Outlier NMDS1"), size = 4, shape = 21 ) + geom_point( data = outliers2$outliers, aes(color = "Outlier NMDS2"), size = 4, shape = 4 ) + scale_color_manual( values = c( group_palette, "Outlier NMDS1" = "red", "Outlier NMDS2" = "orange" ) ) + theme_minimal() + labs(title = "Détection outliers (IQR 1.5)") ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/NMDS outliers res-1.png){.btn .btn-outline-primary} ::: :::{.panel-tabset} #### Script ```{r NMSD clean script} nmds_clean <- nmds_points %>% filter( !row_number() %in% row.names(outliers1$outliers), !row_number() %in% row.names(outliers2$outliers) ) # 5. Enveloppes hulls <- nmds_clean %>% group_by(Group) %>% filter(n() >= 3) %>% slice(chull(NMDS1, NMDS2)) %>% ungroup() # 6. Visualisation + limites NMDS_clean <- ggplot(nmds_clean, aes(x = NMDS1, y = NMDS2, color = Group)) + geom_polygon( data = hulls, aes(fill = Group), alpha = 0.3, color = 'NA', linewidth = 0.5 ) + geom_point(size = 2, alpha = 0.7) + xlim(-0.015, 0.01) + ylim(-0.01, 0.01) + # limites manuelles scale_color_manual(values = group_palette) + scale_fill_manual(values = group_palette) + theme_minimal() + labs(title = "Ordination NMDS", x = "NMDS1", y = "NMDS2") ``` #### Résultats {.active} ```{r NMDS clean res, echo = FALSE, mwarning = FALSE} NMDS_clean ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/NMDS clean res-1.png){.btn .btn-outline-primary} ::: ## Heatmap (REL) :::{.panel-tabset} #### Script **Packages uilisés**\ - *pheatmap*\ - *RColorBrewer* ```{r Heatmap full, output = FALSE} #### Préparation data ---- annotation_col <- data.frame(Cluster = factor(groups)) rownames(annotation_col) <- names(groups) freq <- colSums(FLORE_cover_esp_log > 0, na.rm = TRUE) cols_heat <- colorRampPalette(c("#FFFFFF", "#CE6A6B"))(100) ann_colors <- list(Cluster = group_palette) #### Visualisation ---- heatmap <- pheatmap( t(FLORE_cover_esp_log), color = cols_heat, cluster_rows = FALSE, cluster_cols = clust, annotation_col = annotation_col, fontsize = 3, annotation_colors = ann_colors, show_rownames = TRUE, # Afficher nom espèces show_colnames = TRUE, # Afficher nom REL main = paste("Heatmap transposée (z-score) -", 5, "groupes") ) ``` #### Résultats {.active} ```{r Heatmap full res} heatmap ``` La heatmap est illisble à cause du nombre d'espèces et du nombre du relevés. La heatmap suivante se concentre sur les 30 espèces les plus abondantes. [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/Heatmap full res-1.png){.btn .btn-outline-primary} #### Mini-heatmap ```{r Heatmap light} #### Préparation data ---- top_species <- names(sort(freq, decreasing = TRUE))[1:30] comm_top <- as.matrix(FLORE_cover_esp_log[, top_species]) comm_top_scaled <- t(scale(t(comm_top))) comm_top_clean <- comm_top_scaled[complete.cases(comm_top_scaled), ] comm_top_clean <- comm_top_clean[, complete.cases(t(comm_top_clean))] rel_clean <- rownames(comm_top_clean) annotation_clean <- annotation_col[ rownames(annotation_col) %in% rel_clean, , drop = FALSE ] clust_clean <- hclust(dist(t(comm_top_clean)), method = "ward.D2") ord_cols <- clust_clean$order #### Visualisation ---- pheatmap( t(comm_top_clean)[, ord_cols], color = cols_heat, cluster_rows = FALSE, cluster_cols = FALSE, annotation_col = annotation_clean[ord_cols, , drop = FALSE], annotation_colors = ann_colors, show_rownames = TRUE, show_colnames = TRUE, main = "Top 30 espèces - Z-score (Ward.D2)" ) ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/Heatmap light-1.png){.btn .btn-outline-primary} ::: # Analyses exploratoires (par transect) ## Matrice par transect :::{.panel-tabset} #### Script ```{r matrice par transect, warning = FALSE} FLORE_cover_esp_transect <- FLORE_cover_esp FLORE_cover_min <- FLORE_cover[ rowSums(FLORE_cover[, -c(1, 2)], na.rm = TRUE) > 0, ] FLORE_cover_esp_transect$transect <- FLORE_cover_min$transect_numb # FLORE_cover_esp_transect <- FLORE_cover_esp_transect[, c("transect", names(FLORE_cover_esp))] FLORE_transect_esp <- FLORE_cover_esp_transect %>% group_by(transect) %>% summarise(across(where(is.numeric), mean, na.rm = TRUE)) %>% # ici, mean car le nombre de transect est différent par transect ungroup() # matrice avec nom des lignes = transect FLORE_transect_esp_mat <- as.matrix(FLORE_transect_esp[, -1]) rownames(FLORE_transect_esp_mat) <- FLORE_transect_esp$transect # transformation en log FLORE_transect_log <- log1p(FLORE_transect_esp_mat) FLORE_transect_log <- FLORE_transect_log[ rowSums(FLORE_transect_log, na.rm = TRUE) > 0, ] ``` #### Résultats {.active} ```{r, echo = FALSE} write_xlsx( FLORE_transect_esp, path = file.path(path_res, "FLORE_transect_esp.xlsx") ) datatable(FLORE_transect_esp) ``` [Télécharger ce tableau](../04.results/FLORE_transect_esp.xlsx){.btn .btn-outline-primary} ::: ## Dendrogramme (TRANSECT) :::{.panel-tabset} #### Script ```{r Dendrogramme} #### Préparation data ---- dist_transect <- vegdist(FLORE_transect_log, method = "bray") clust_transect <- hclust(dist_transect, method = "ward.D2") groups_transect <- cutree(clust_transect, k = 5) ``` #### Résultats {.active} ```{r Dendrogramme TR res, echo = FALSE} #### Visualisation ---- plot( color_branches( as.dendrogram(clust_transect), k = 5, col = group_palette[as.character(1:5)] ), main = "Dendrogramme coloré (Ward) - Transects", xlab = "Transects", cex = 0.5 ) ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/Dendrogramme TR res-1.png){.btn .btn-outline-primary} ::: ## ANOSIM (TRANSECT) :::{.panel-tabset} #### Script ```{r ANOSIM RE script} anosim_transect <- anosim( FLORE_transect_log, groups_transect, permutations = 999 ) ``` #### Résultats {.active} ```{r ANOSIM TR res, echo = FALSE} anosim_transect ``` ::: ## SIMPER (TRANSECT) :::{.panel-tabset} #### Script ```{r SIMPER TR} simper_transect <- simper( FLORE_transect_esp_mat, factor(groups_transect), permutations = 99 ) characteristic_species_transect <- top5_all(simper_transect, top_n = 5) ``` #### Résultats {.active} ```{r SIMPER res TR, echo = FALSE} characteristic_species_transect ``` ::: ## Diagramme de Venn (TRANSECT) Le diagramme de Venn permet de visualiser les résultats du SIMPER. :::{.panel-tabset} #### Script **Package utilisé**\ - *VennDiagram* ```{r Diagramme de Venn t, output = FALSE} #### Préparation data ---- extract_species_filtered_transect <- function( simper_obj, top_n = 5, min_freq = 2 ) { species_list <- list() for (comp in names(simper_obj)) { df <- as.data.frame(simper_obj[[comp]]) df <- df[order(-df$average), ] # tri décroissant top_species <- head(rownames(df), top_n) # top 5 groups <- strsplit(comp, "_")[[1]] for (g in groups) { species_list[[g]] <- c(species_list[[g]], top_species) } } lapply(species_list, function(x) { freq <- sort(table(x), decreasing = TRUE) names(freq[freq >= min_freq]) }) } filtered_species_transect <- extract_species_filtered_transect( simper_transect, top_n = 5, min_freq = 2 ) #### Visualisation ---- venn.plot_transect <- venn.diagram( x = list( Groupe1 = filtered_species_transect[["1"]], Groupe2 = filtered_species_transect[["2"]], Groupe3 = filtered_species_transect[["3"]], Groupe4 = filtered_species_transect[["4"]], Groupe5 = filtered_species_transect[["5"]] ), filename = NULL, fill = group_palette[as.character(1:5)], alpha = 0.4, cex = 1.2, cat.cex = 0.8, cat.fontface = "bold", margin = 0.1 ) ``` #### Résultats {.active} ```{r Diagramme de Venn TR res, echo = FALSE} grid.newpage() grid.draw(venn.plot_transect) ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/Diagramme de Venn TR res-1.png.png){.btn .btn-outline-primary} ::: ## NMDS (TRANSECT) :::{.panel-tabset} #### Script ```{r nMDS t, output = FALSE} #### Préparation data ---- nmds_transect <- metaMDS( FLORE_transect_log, distance = "bray", k = 2, try = 100 ) ``` ```{r NMDS TR stress, echo = FALSE} print(paste("Stress =", round(nmds_transect$stress, 3))) ``` ```{r NMDS suite} nmds_tr_pts <- as.data.frame(scores(nmds_transect, display = "sites")) nmds_tr_pts$Transect <- rownames(nmds_tr_pts) nmds_tr_pts$Group <- factor(groups_transect[nmds_tr_pts$Transect]) # Hulls hulls_tr <- nmds_tr_pts %>% group_by(Group) %>% slice(chull(NMDS1, NMDS2)) ``` #### Résultats {.active} ```{r NMDS TR res, echo = FALSE} #### Visualisation ---- ggplot(nmds_tr_pts, aes(NMDS1, NMDS2, color = Group)) + geom_polygon(data = hulls_tr, aes(fill = Group), alpha = 0.2, color = NA) + geom_point(size = 3, alpha = 0.8) + geom_text_repel(aes(label = Transect), size = 3, max.overlaps = 20) + scale_color_manual(values = group_palette) + scale_fill_manual(values = group_palette) + theme_minimal() + labs( title = paste("NMDS transects - Stress =", round(nmds_transect$stress, 3)), x = "NMDS1", y = "NMDS2", color = "Groupe" ) ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/NMDS TR res-1.png){.btn .btn-outline-primary} ::: ## Heatmap (TRANSECT) :::{.panel-tabset} #### Script ```{r Heatmap t} # Fréquences globales freq_tr <- colSums(FLORE_transect_log > 0, na.rm = TRUE) top_species_tr <- names(sort(freq_tr, decreasing = TRUE))[1:30] comm_tr_top <- as.matrix(FLORE_transect_log[, top_species_tr]) comm_tr_scaled <- t(scale(t(comm_tr_top))) comm_tr_clean <- comm_tr_scaled[complete.cases(comm_tr_scaled), ] comm_tr_clean <- comm_tr_clean[, complete.cases(t(comm_tr_clean))] # Annotation transects annotation_tr <- data.frame( Cluster = factor(groups_transect[rownames(comm_tr_clean)]) ) rownames(annotation_tr) <- rownames(comm_tr_clean) # Clustering Ward sur transects (z-scores) clust_tr_clean <- hclust(dist(comm_tr_clean), method = "ward.D2") library(pheatmap) cols_heat <- colorRampPalette(c("#FFFFFF", "#CE6A6B"))(100) ann_colors_tr <- list(Cluster = group_palette) ``` #### Résultats {.active} ```{r Heatmap TR res, echo = FALSE} pheatmap( t(comm_tr_clean), color = cols_heat, cluster_rows = FALSE, cluster_cols = clust_tr_clean, annotation_col = annotation_tr, annotation_colors = ann_colors_tr, show_rownames = TRUE, show_colnames = TRUE, main = "Top 30 espèces - Z-score (Ward.D2) par transect" ) ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/Heatmap TR res-1.png){.btn .btn-outline-primary} ::: # Analyses diversité spécifique :::{.panel-tabset} #### Script **Package utilisé**\ - *dplyr* - *vegan* - *ggplot2* ## Richesse spécifique La richesse spécifique a été calculée pour chaque relevé puis les résultats ont été emboités à la matrice METADATA. ```{r Richesse spécifique par relevé, filename = "Richesse spécifique"} # Richesse spé par relevé richesse_rel <- data.frame( REL = FLORE_cover$REL, Richesse = rowSums(FLORE_cover[, species_cols] > 0, na.rm = TRUE) ) %>% mutate(Richesse = Richesse) METADATA <- METADATA %>% left_join(richesse_rel, by = "REL") ``` ## Indice de Shannon En utilisant le recouvrement moyen (%), l'indice de Shannon a été calculé pour chaque relevé puis les résultats ont été emboités à la matrice METADATA. ```{r Shannon par relevé, filename = "Shannon"} shannon_rel <- diversity(FLORE_cover[, species_cols], index = "shannon") METADATA <- METADATA %>% left_join( data.frame(REL = FLORE_cover$REL, Shannon = shannon_rel), by = "REL" ) ``` L'indice de Shannon a ensuite été moyenné par transect. ```{r Shannon par transect, filename = "Shannon par transect"} # Shannon par transect shannon_transect <- METADATA %>% group_by(transect_numb) %>% summarise( shannon_moy = mean(Shannon), shannon_sd = sd(Shannon), n_releves = n(), .groups = "drop" ) ``` ## Inverse de Simpson En utilisant le recouvrement moyen (%), l'inverse de Simpson a été calculé pour chaque relevé puis les résultats ont été emboités à la matrice METADATA. ```{r inverse de Simpson, filename = "Inverse de Simpson"} Simpson_inv_rel <- diversity(FLORE_cover[, species_cols], index = "invsimpson") METADATA <- METADATA %>% left_join( data.frame(REL = FLORE_cover$REL, Simpson_inv_rel = Simpson_inv_rel), by = "REL" ) ``` **OUTPUT**\ - *richesse_rel \[453 x 2\] :* richesse spécifique S (0D) par relevé. - *shannon_rel \[453 x 2\] :* indice de Shannon H' (1D) par relevé. - *res_shannon \[94 x 4\] :* indice de Shannon H' (1D) par transect. - *Simpson_inv_rel :* inverse de Simpson (2D) par relevé. #### Richesse (q0) ```{r richesse dl, echo = FALSE} write_xlsx( richesse_rel, path = file.path(path_res, "richesse_rel.xlsx") ) datatable(richesse_rel) ``` [Télécharger ce tableau](../04.results/richesse_rel.xlsx){.btn .btn-outline-primary} #### Shannon (q1) ```{r shannon dl, echo = FALSE, filname = "Shannon par relevé"} df_shannon <- data.frame( REL = FLORE_cover$REL, Shannon = shannon_rel ) write_xlsx( df_shannon, path = file.path(path_res, "shannon_rel.xlsx") ) datatable(df_shannon) ``` [Télécharger ce tableau](../04.results/df_shannon.xlsx){.btn .btn-outline-primary} #### Inverse de Simpson (q2) ```{r simpson dl, echo = FALSE} df_simpson_inv <- data.frame( REL = FLORE_cover$REL, Shannon = Simpson_inv_rel ) write_xlsx( df_simpson_inv, path = file.path(path_res, "Simpson_inv_rel.xlsx") ) datatable(df_simpson_inv) ``` [Télécharger ce tableau](../04.results/Simpson_inv_rel.xlsx){.btn .btn-outline-primary} #### Régression Enfin, une droite de régression a été tracée entre les deux indices (Shannon \~ Richesse). ```{r shannon ~ richesse, filename = "shannon ~ richesse"} plot(Shannon ~ Richesse, data = METADATA) lm(Shannon ~ Richesse, data = METADATA) ggplot(METADATA, aes(x = Richesse, y = Shannon)) + geom_point(alpha = 0.6, color = "bisque3") + geom_smooth(method = "lm", se = TRUE, color = "aquamarine4", size = 1.2) + labs( title = "Richesse spécifique vs Indice de Shannon (2021)", x = "Richesse spécifique S", y = "Indice de Shannon H'" ) + theme_minimal() + theme( plot.title = element_text(hjust = 0.5, face = "bold", size = 14) ) ``` ::: ## Transects Un tableau est créé pour avoir le nombre de relevés, le nombre d'habitat, le nombre de faciès et la richesse spécifique pour chaque transect. :::{.panel-tabset} #### Script **Package utilisé**\ - *dplyr* ```{r METADATA_transect} # Création d'un dataset METADATA_transect <- METADATA %>% group_by(transect_numb) %>% mutate( Simpson_inv_rel = ifelse( is.infinite(Simpson_inv_rel), Richesse, Simpson_inv_rel ) ) %>% summarise( n_releves = n(), n_habitats = n_distinct(Type_habitat, na.rm = TRUE), n_facies = n_distinct(id_facies, na.rm = TRUE), Richesse_moy = mean(Richesse, na.rm = TRUE), Richesse_sd = sd(Richesse, na.rm = TRUE), Shannon_moy = mean(Shannon, na.rm = TRUE), Shannon_sd = sd(Shannon, na.rm = TRUE), Simpson_moy = mean(Simpson_inv_rel, na.rm = TRUE), Simpson_sd = sd(Simpson_inv_rel, na.rm = TRUE), .groups = "drop" ) %>% arrange(transect_numb) ``` **OUTPUT**\ - *METADATA_transect \[94 x 4\] :* pour chaque transect, nombre de relevés, nombre d'habitats, nombre de faciès et les indices 0D, 1D et 2D (moyenne et écart-type). #### Tableau {.active} ```{r transect Hill, echo = FALSE} write_xlsx( METADATA_transect, path = file.path(path_res, "METADATA_transect.xlsx") ) datatable(METADATA_transect) ``` [Télécharger ce tableau](../04.results/METADATA_transect.xlsx){.btn .btn-outline-primary} ::: # Nombres de Hill Les nombres de Hill permettent de mesurer la diversité d'une communauté de manière cohérente entre indices et directement interprétable en nombre d'espèces effectives. Ils mettent la richesse spécifique, Shannon et Simpson sur la même échelle (ordres *q*), comparables entre eux. :::{.panel-tabset} #### Script **Packages utilisés**\ - *dplyr*\ - *tidyr* ```{r Nombres de Hill} #### Diversité spécifique ---- Hill_0s <- richesse_rel$Richesse Hill_1s <- exp(shannon_rel) Hill_2s <- Simpson_inv_rel #### Dataset Hill Spécifique Hill_spe_transect <- METADATA %>% group_by(transect_numb) %>% mutate( Simpson_inv_corr = ifelse(is.infinite(Simpson_inv_rel), 1, Simpson_inv_rel) ) %>% # Résultats 'inf' dans les valeurs de l'inverse de Simpson donc correction summarise( Hill0_moy = mean(Richesse, na.rm = TRUE), Hill0_sd = sd(Richesse, na.rm = TRUE), Hill1_moy = mean(exp(Shannon), na.rm = TRUE), Hill1_sd = sd(exp(Shannon), na.rm = TRUE), Hill2_moy = mean(Simpson_inv_corr, na.rm = TRUE), # Utilisation de la correction Hill2_sd = sd(Simpson_inv_corr, na.rm = TRUE), # pour ne plus avoir de 'inf' n_releves = n(), .groups = "drop" ) Hill_transect_long <- Hill_spe_transect %>% select(transect_numb, Hill0_moy, Hill1_moy, Hill2_moy) %>% pivot_longer( cols = starts_with("Hill"), names_to = "Indice", values_to = "Valeur" ) ``` **OUTPUT**\ - *Hill_xs :* vecteurs des 3 ordres de nombres de Hill représentant la richesse spécifique (0D), l'indice de Shannon en exp (1D) et l'inverse de Simpson (2D).\ - *Hill_transect :* dataframe des indices de diversité spéicifique sous nombres de Hill par transect.\ - *Hill_transect_long :* dataframe en long. #### Tableau {.active} ```{r Hill res, echo = FALSE} write_xlsx( Hill_spe_transect, path = file.path(path_res, "Hill_spe_transect.xlsx") ) datatable(Hill_spe_transect) ``` [Télécharger ce tableau](../04.results/Hill_spe_transect.xlsx){.btn .btn-outline-primary} ::: :::{.panel-tabset} #### Script **Package utilisé**\ - *ggplot2* ```{r graph div, output = FALSE} graph_diversite <- ggplot( Hill_transect_long, aes(x = transect_numb, y = Valeur, color = Indice, group = Indice) ) + geom_line(size = 1) + geom_point(size = 1.5) + labs( x = "Transect", y = "Nombre de Hill moyen (0D, 1D, 2D)", title = "Diversité spécifique d'ordre 0, 1 et 2 par transect" ) + theme_minimal() + theme( axis.text.x = element_text(angle = 45, hjust = 1), plot.title = element_text(hjust = 0.5) ) ``` #### Résultats {.active} ```{r graph res, echo = FALSE} graph_diversite ``` [Télécharger ce graphique](Script_diversite_specifique_files/figure-html/graph res-1.png){.btn .btn-outline-primary} ::: ```{r} cor( Hill_spe_transect$Hill0_moy, Hill_spe_transect$Hill1_moy, use = "complete.obs" ) cor( Hill_spe_transect$Hill0_moy, Hill_spe_transect$Hill2_moy, use = "complete.obs" ) cor( Hill_spe_transect$Hill1_moy, Hill_spe_transect$Hill2_moy, use = "complete.obs" ) ```